Компания Google анонсировала новую языковую модель Gemini 2.5 Pro

31.03.2025

~ 2 мин

718

Простой

Новости

Введение

25 марта 2025 года Google представила свою новую LLM Gemini 2.5 Pro, заявив, что это “умнейшая языковая модель” среди всех современных нейросетей. Передовой ИИ войдет в семейство моделей Gemini 2.5 и будет поддерживать контекстное окно до 1 миллиона токенов.

Особенности Gemini 2.5 Pro

Главное нововведение языковой модели Gemini 2.5 Pro — поддержка функции рассуждения. Теперь перед генерацией самого ответа нейросеть будет рассуждать на заданную тематику в поисках более релевантных тезисов, впоследствии предоставляя наиболее точный ответ. В отличие от предыдущих нейросетей версии Gemini 2.0 Flash Thinking, размышление Gemini 2.5 Pro не будет показываться пользователю при стандартных настройках, однако, для демонстрации хода мыслей модели можно будет вручную включить параметр “размышление вслух”.

В области увеличения производительности Gemini 2.5 Pro также обходит своих предшественников и некоторые языковые модели конкурентов. Прирост производительности обеспечивается оптимизацией архитектуры искусственного интеллекта и применением передового метода “обучения с подкреплением”. Исходя из результатов тестирования LMArena, представленных компанией Google, можно сделать вывод, что пользователи предпочитают именно модель Gemini 2.5 Pro, нежели предыдущие версии нейросетей семейства Gemini.

Производительность Gemini 2.5 Pro в бенчмарках

Результаты бенчмарков модели Gemini 2.5 Pro в сравнении с другими популярными LLM. Источник: Google Blog.

Кроме того, компания привела результаты бенчмарков для оценки производительности в математических (AIME 2025) и научных вычислениях (GPQA diamond), которые продемонстрировали, что Gemini 2.5 Pro превосходит такие передовые нейросети, как GPT-4.5, GPT-o3-mini, Claude 3.7 Sonnet, DeepSeek R1 и Grok 3. В тесте Humanity’s Last Exam модель Gemini 2.5 Pro набрала рекордные 18,8 % без применения дополнительных инструментов, в то время как предыдущий рекордсмен теста среди LLM DeepSeek R1 набрал всего 9,4%.

Производительность Gemini 2.5 Pro в математических и научных вычислениях

Производительность Gemini 2.5 Pro в научных и математических вычислениях. Источник: Google Blog.

Производительность модели Gemini 2.5 Pro в сфере кодинга также значительно увеличилась, набрав 63,8 % в тесте SWE-Bench Verified, однако, только при использовании нейросети в качестве ИИ-агента. Также стоит отметить, что Gemini 2.5 Pro является не только размышляющей, но и мультимодальной моделью, которая способна работать как с текстом, так и медиа-файлами, а также обрабатывать большие объемы данных и полные репозитории кода за счет колоссального контекстного окна в 1 миллион токенов. Причем, разработчики поделились, что в скором времени контекстное окно будет расширено еще на 1 миллион токенов. Также Google заявила, что в течение нескольких недель Gemini 2.5 Pro появится в Vertex AI, а позднее нейросеть можно будет использовать в крупных проектах за счет пересмотра политики правообладания. В данный момент Gemini 2.5 Pro могут опробовать только обладатели платной подписки и разработчики в тестовом режиме.

Выводы

Если результаты бенчмарков правдивы, то Gemini 2.5 Pro является одной из самых производительных нейросетей в мире, обойдя как самые современные западные, так и китайские LLM. Однако, с учетом активного развития рынка искусственного интеллекта, не исключено, что уже в ближайшее время выйдет новая языковая модель, в частности, GPT-5, которой удастся побить все рекорды в популярных ИИ-бенчмарках.

Автор:

Serverflow

Комментарии 1

Слон

Сравнение с DeepSeek R1 в редакции v3, которая вышла на днях? Или ребята из Google решили сделать удобное маркетинговое сравнение?

В пресс-релизе они уточнили, что речь идет только про задания касательно генерации текста, а там и предыдущая версия гемини сильно обгоняла дипсик. Но уточнения версии там действительно нет.