Технэ

2025 год: Переломный год для ИИ

2025 год ознаменовался стремительным развитием сферы искусственного интеллекта (ИИ): выпуском новых моделей, прогрессом в области агентных систем (agentic AI) и расширением мультимодальных возможностей. На протяжении всего года обострялась конкуренция между ведущими компаниями США и Китая, что привело к установлению новых стандартов в бенчмарках.

Прорыв DeepSeek

Начало года выделилось успехом китайской компании DeepSeek. Выпущенная в январе модель с открытым исходным кодом DeepSeek R1, обучение которой стоило всего 6 миллионов долларов, превзошла флагманские модели OpenAI и Google в тестах по математике и программированию. В декабре компания представила версии DeepSeek-V3.2 и V3.2-Speciale, которые конкурентоспособны с Gemini 3.0-Pro и отличаются высокой эффективностью в задачах с длительными рассуждениями и агентных поручениях.

Успехи xAI и Grok

Чат-бот Grok от компании xAI также зафиксировал значительный прогресс. Модель Grok 3, выпущенная 17 февраля, обучалась на суперкомпьютере Colossus с использованием около 200 000 GPU, что в 10 раз превышает предыдущие вычислительные мощности. Она заняла лидирующие позиции в бенчмарках по математике, науке и программированию. В июле была представлена Grok 4 (включая версию Heavy), считающаяся одной из умнейших моделей в мире, а 17 ноября — Grok 4.1 с улучшенными творческими, эмоциональными и коллаборативными способностями.

Линейка Gemini от Google

Серия Gemini оставалась в центре событий года. Выпущенная в ноябре Gemini 3 лидирует в области мультимодального понимания и агентного кодирования. В декабре компания представила Gemini 3 Flash (быстрая и дешевая версия для поискового режима AI Mode) и Gemini 3 Deep Think (для решения сложных задач). Эти модели интегрированы в приложение Gemini, платформы Vertex AI и Antigravity.

OpenAI и Anthropic

OpenAI в декабре выпустила GPT-5.2, сфокусированную на профессиональных задачах и долгосрочных агентах. Ранее, в феврале, была представлена GPT-4.5 (Research Preview), а в декабре — GPT Image 1.5 для генерации изображений (в четыре раза быстрее и с более точным редактированием).

Линейка Claude от компании Anthropic выделилась высоким уровнем безопасности. Выпущенные в сентябре Claude Sonnet 4.5 и в ноябре Claude Opus 4.5 превзошли конкурентов в тестах SWE-bench и OSWorld, особенно в программировании и агентных задачах.

Мультимодальные технологии

В сфере генерации видео лидерами стали:

Sora 2 от OpenAI (декабрь: более длинные и реалистичные видео);

Veo 3 от Google (высокое качество и кинематографическое управление);

Runway Gen-4 (создание сложных сцен с аудио и движением по тексту).

Генерация изображений и звука: Прогресс в изображениях включает Google Nano Banana Pro (лучший в интеграции текста), OpenAI GPT Image 1.5 и Flux.2 (высокий реализм). В сфере аудио выделились Google Gemini 2.5 Native Audio (разговоры в реальном времени), модели ElevenLabs и Hume AI Octave TTS (эмоциональные и естественные голоса).

Будущее агентного ИИ

Согласно отчету Gartner 2025 Hype Cycle, агентный ИИ стал самой быстроразвивающейся технологией. Прогнозируется, что к 2028 году 33% предприятий будут использовать его для автономного выполнения сложных задач.