Компания Google анонсировала новую языковую модель Gemini 2.5 Pro
Автор: ServerFlow
Google представила передовую модель Gemini 2.5 Pro.
Введение
25 марта 2025 года Google представила свою новую LLM Gemini 2.5 Pro, заявив, что это “умнейшая языковая модель” среди всех современных нейросетей. Передовой ИИ войдет в семейство моделей Gemini 2.5 и будет поддерживать контекстное окно до 1 миллиона токенов.
Особенности Gemini 2.5 Pro
Главное нововведение языковой модели Gemini 2.5 Pro — поддержка функции рассуждения. Теперь перед генерацией самого ответа нейросеть будет рассуждать на заданную тематику в поисках более релевантных тезисов, впоследствии предоставляя наиболее точный ответ. В отличие от предыдущих нейросетей версии Gemini 2.0 Flash Thinking, размышление Gemini 2.5 Pro не будет показываться пользователю при стандартных настройках, однако, для демонстрации хода мыслей модели можно будет вручную включить параметр “размышление вслух”.
В области увеличения производительности Gemini 2.5 Pro также обходит своих предшественников и некоторые языковые модели конкурентов. Прирост производительности обеспечивается оптимизацией архитектуры искусственного интеллекта и применением передового метода “обучения с подкреплением”. Исходя из результатов тестирования LMArena, представленных компанией Google, можно сделать вывод, что пользователи предпочитают именно модель Gemini 2.5 Pro, нежели предыдущие версии нейросетей семейства Gemini.
Результаты бенчмарков модели Gemini 2.5 Pro в сравнении с другими популярными LLM. Источник: Google Blog.
Кроме того, компания привела результаты бенчмарков для оценки производительности в математических (AIME 2025) и научных вычислениях (GPQA diamond), которые продемонстрировали, что Gemini 2.5 Pro превосходит такие передовые нейросети, как GPT-4.5, GPT-o3-mini, Claude 3.7 Sonnet, DeepSeek R1 и Grok 3. В тесте Humanity’s Last Exam модель Gemini 2.5 Pro набрала рекордные 18,8 % без применения дополнительных инструментов, в то время как предыдущий рекордсмен теста среди LLM DeepSeek R1 набрал всего 9,4%.
Производительность Gemini 2.5 Pro в научных и математических вычислениях. Источник: Google Blog.
Производительность модели Gemini 2.5 Pro в сфере кодинга также значительно увеличилась, набрав 63,8 % в тесте SWE-Bench Verified, однако, только при использовании нейросети в качестве ИИ-агента. Также стоит отметить, что Gemini 2.5 Pro является не только размышляющей, но и мультимодальной моделью, которая способна работать как с текстом, так и медиа-файлами, а также обрабатывать большие объемы данных и полные репозитории кода за счет колоссального контекстного окна в 1 миллион токенов. Причем, разработчики поделились, что в скором времени контекстное окно будет расширено еще на 1 миллион токенов. Также Google заявила, что в течение нескольких недель Gemini 2.5 Pro появится в Vertex AI, а позднее нейросеть можно будет использовать в крупных проектах за счет пересмотра политики правообладания. В данный момент Gemini 2.5 Pro могут опробовать только обладатели платной подписки и разработчики в тестовом режиме.
Выводы
Если результаты бенчмарков правдивы, то Gemini 2.5 Pro является одной из самых производительных нейросетей в мире, обойдя как самые современные западные, так и китайские LLM. Однако, с учетом активного развития рынка искусственного интеллекта, не исключено, что уже в ближайшее время выйдет новая языковая модель, в частности, GPT-5, которой удастся побить все рекорды в популярных ИИ-бенчмарках.
Компания Google анонсировала новую языковую модель Gemini 2.5 Pro
25 марта 2025 года Google представила свою новую LLM Gemini 2.5 Pro, заявив, что это “умнейшая языковая модель” среди всех современных нейросетей. Передовой ИИ войдет в семейство моделей Gemini 2.5 и будет поддерживать контекстное окно до 1 миллиона токенов.
Особенности Gemini 2.5 Pro
Главное нововведение языковой модели Gemini 2.5 Pro — поддержка функции рассуждения. Теперь перед генерацией самого ответа нейросеть будет рассуждать на заданную тематику в поисках более релевантных тезисов, впоследствии предоставляя наиболее точный ответ. В отличие от предыдущих нейросетей версии Gemini 2.0 Flash Thinking, размышление Gemini 2.5 Pro не будет показываться пользователю при стандартных настройках, однако, для демонстрации хода мыслей модели можно будет вручную включить параметр “размышление вслух”.
В области увеличения производительности Gemini 2.5 Pro также обходит своих предшественников и некоторые языковые модели конкурентов. Прирост производительности обеспечивается оптимизацией архитектуры искусственного интеллекта и применением передового метода “обучения с подкреплением”. Исходя из результатов тестирования LMArena, представленных компанией Google, можно сделать вывод, что пользователи предпочитают именно модель Gemini 2.5 Pro, нежели предыдущие версии нейросетей семейства Gemini.
Результаты бенчмарков модели Gemini 2.5 Pro в сравнении с другими популярными LLM. Источник: Google Blog.
Кроме того, компания привела результаты бенчмарков для оценки производительности в математических (AIME 2025) и научных вычислениях (GPQA diamond), которые продемонстрировали, что Gemini 2.5 Pro превосходит такие передовые нейросети, как GPT-4.5, GPT-o3-mini, Claude 3.7 Sonnet, DeepSeek R1 и Grok 3. В тесте Humanity’s Last Exam модель Gemini 2.5 Pro набрала рекордные 18,8 % без применения дополнительных инструментов, в то время как предыдущий рекордсмен теста среди LLM DeepSeek R1 набрал всего 9,4%.
Производительность Gemini 2.5 Pro в научных и математических вычислениях. Источник: Google Blog.
Производительность модели Gemini 2.5 Pro в сфере кодинга также значительно увеличилась, набрав 63,8 % в тесте SWE-Bench Verified, однако, только при использовании нейросети в качестве ИИ-агента. Также стоит отметить, что Gemini 2.5 Pro является не только размышляющей, но и мультимодальной моделью, которая способна работать как с текстом, так и медиа-файлами, а также обрабатывать большие объемы данных и полные репозитории кода за счет колоссального контекстного окна в 1 миллион токенов. Причем, разработчики поделились, что в скором времени контекстное окно будет расширено еще на 1 миллион токенов. Также Google заявила, что в течение нескольких недель Gemini 2.5 Pro появится в Vertex AI, а позднее нейросеть можно будет использовать в крупных проектах за счет пересмотра политики правообладания. В данный момент Gemini 2.5 Pro могут опробовать только обладатели платной подписки и разработчики в тестовом режиме.
Выводы
Если результаты бенчмарков правдивы, то Gemini 2.5 Pro является одной из самых производительных нейросетей в мире, обойдя как самые современные западные, так и китайские LLM. Однако, с учетом активного развития рынка искусственного интеллекта, не исключено, что уже в ближайшее время выйдет новая языковая модель, в частности, GPT-5, которой удастся побить все рекорды в популярных ИИ-бенчмарках.
Сравнение с DeepSeek R1 в редакции v3, которая вышла на днях? Или ребята из Google решили сделать удобное маркетинговое сравнение?
Serverflow
В пресс-релизе они уточнили, что речь идет только про задания касательно генерации текста, а там и предыдущая версия гемини сильно обгоняла дипсик. Но уточнения версии там действительно нет.
Получите скидку 3 000 рублей или бесплатную доставку за подписку на новости*!
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.