2025 год ознаменовался стремительным развитием сферы искусственного интеллекта (ИИ): выпуском новых моделей, прогрессом в области агентных систем (agentic AI) и расширением мультимодальных возможностей. На протяжении всего года обострялась конкуренция между ведущими компаниями США и Китая, что привело к установлению новых стандартов в бенчмарках.
Прорыв DeepSeek
Начало года выделилось успехом китайской компании DeepSeek. Выпущенная в январе модель с открытым исходным кодом DeepSeek R1, обучение которой стоило всего 6 миллионов долларов, превзошла флагманские модели OpenAI и Google в тестах по математике и программированию. В декабре компания представила версии DeepSeek-V3.2 и V3.2-Speciale, которые конкурентоспособны с Gemini 3.0-Pro и отличаются высокой эффективностью в задачах с длительными рассуждениями и агентных поручениях.
Успехи xAI и Grok
Чат-бот Grok от компании xAI также зафиксировал значительный прогресс. Модель Grok 3, выпущенная 17 февраля, обучалась на суперкомпьютере Colossus с использованием около 200 000 GPU, что в 10 раз превышает предыдущие вычислительные мощности. Она заняла лидирующие позиции в бенчмарках по математике, науке и программированию. В июле была представлена Grok 4 (включая версию Heavy), считающаяся одной из умнейших моделей в мире, а 17 ноября — Grok 4.1 с улучшенными творческими, эмоциональными и коллаборативными способностями.
Линейка Gemini от Google
Серия Gemini оставалась в центре событий года. Выпущенная в ноябре Gemini 3 лидирует в области мультимодального понимания и агентного кодирования. В декабре компания представила Gemini 3 Flash (быстрая и дешевая версия для поискового режима AI Mode) и Gemini 3 Deep Think (для решения сложных задач). Эти модели интегрированы в приложение Gemini, платформы Vertex AI и Antigravity.
OpenAI и Anthropic
OpenAI в декабре выпустила GPT-5.2, сфокусированную на профессиональных задачах и долгосрочных агентах. Ранее, в феврале, была представлена GPT-4.5 (Research Preview), а в декабре — GPT Image 1.5 для генерации изображений (в четыре раза быстрее и с более точным редактированием).
Линейка Claude от компании Anthropic выделилась высоким уровнем безопасности. Выпущенные в сентябре Claude Sonnet 4.5 и в ноябре Claude Opus 4.5 превзошли конкурентов в тестах SWE-bench и OSWorld, особенно в программировании и агентных задачах.
Мультимодальные технологии
В сфере генерации видео лидерами стали:
Sora 2 от OpenAI (декабрь: более длинные и реалистичные видео);
Veo 3 от Google (высокое качество и кинематографическое управление);
Runway Gen-4 (создание сложных сцен с аудио и движением по тексту).
Генерация изображений и звука: Прогресс в изображениях включает Google Nano Banana Pro (лучший в интеграции текста), OpenAI GPT Image 1.5 и Flux.2 (высокий реализм). В сфере аудио выделились Google Gemini 2.5 Native Audio (разговоры в реальном времени), модели ElevenLabs и Hume AI Octave TTS (эмоциональные и естественные голоса).
Будущее агентного ИИ
Согласно отчету Gartner 2025 Hype Cycle, агентный ИИ стал самой быстроразвивающейся технологией. Прогнозируется, что к 2028 году 33% предприятий будут использовать его для автономного выполнения сложных задач.