Китайская нейросеть Qwen2.5-Max от Alibaba превзошла DeepSeek V3 и ChatGPT-4o

29.01.2025

~ 15 мин

15138

Простой

Статьи

Содержание:

Введение
Ажиотаж на рынке ИИ
Что такое Qwen2.5-Max?
Что будет с рынком ИИ дальше?
Выводы

Введение

До недавнего времени лидерами в секторе создания искусственного интеллекта считались США, а амбассадорами индустрии считались такие компании, как OpenAI, *Meta, Google и Microsoft, Однако, в начале 2025 года на рынок неожиданно вышли китайские разработчики из Alibaba и DeepSeek, вызвав ажиотаж во всем мире. Но 28 января КНР не оставила западным языковым моделям и шанса, выпустив универсальную нейросеть Qwen2.5-Max от компании Alibaba, которая затмила как ChatGPT-4o, так и DeepSeek V3.

Qwen является дочерней компанией крупной корпорации Alibaba Cloud. Источник: Qwen.

Ажиотаж на рынке ИИ

В январе 2025 Китай объявил настоящую войну западной индустрии искусственного интеллекта. Сначала языковые модели DeepSeek V3 и R1 превзошли ChatGPT-4o в программировании, математике и других задачах. Нейросеть *Llama 4, которая еще даже не вышла, тоже попала под удар, так как DeepSeek, согласно результатам тестирований, обошла даже ее. Но это было лишь началом марафона китайских ИИ, так как через неделю была выпущен генеративный ИИ Janus-Pro-7B от разработчиков DeepSeek, который справляется с генерацией изображений лучше, чем DALL-E 3 и Stable Diffusion. Вслед за этим, мобильное приложение DeepSeek стало самой популярной бесплатной программой в App Store, что вызвало большую нагрузку на сервера разработчиков. Также DeepSeek отметила, что неизвестные хакеры устроили атаку на сервера компании, из-за чего было принято решение временно ограничить регистрацию пользователей в ИИ, но это ограничение быстро сняли. Несмотря на это, нейросеть продолжила набирать популярность, оттесняя ChatGPT и других конкурентов.

Сравнение DeepSeek R1 с другими моделями ИИ

Результаты сравнения производительности DeepSeek R1 с другими моделями ИИ при решении разных задач. Источник: DeepSeek.

Это вызвало массовое падение акций крупных западных ИИ-компаний, включая Microsoft, Google, Amazon, а Nvidia вовсе установили антирекорд — за день капитализация компании снизилась на $465 млрд из-за обвала акций на 12%, что является самым большим дневным падением в истории фондового рынка. Также в результате этого Nvidia перестала быть самой дорогой компанией в мире, уступив Apple и Microsoft.

Nvidia 27 января 2025 года потеряла 589 миллиардов долларов

Рейтинг самых больших дневных потерь капитализации компаний теперь возглавляет Nvidia, которая 27 января потеряла 589 миллиардов долларов. Источник: Bloomberg.

Что такое Qwen2.5-Max?

Но Китай решил не останавливаться на этих достижениях DeepSeek, выпустив 28 января 2025 года новую, мощнейшую нейросеть Qwen2.5-Max от Alibaba, которая превзошла не только всех западных конкурентов, но и обошла передовые модели DeepSeek в бенчмарках Arena Hard, LiveBench, LiveCodeBench, GPQA-Diamond. Qwen2.5-Max — это передовая языковая модель, которая является улучшенной версией нейросети Qwen2.5-1M. Модель Qwen2.5-Max использует 20 триллионов токенов для генерации ответов, а также продолжает совершенствоваться благодаря методу пост-обучения. Компания Alibaba Cloud не раскрывает точное количество параметров, которые использовались при создании Qwen2.5-Max, оценивая эффективность модели в количестве токенов, что не очень информативно, так как западные модели, такие как Llama и ChatGPT, обычно оцениваются именно в кол-ве параметров — 7B, 32B, 70B, 90B и так далее.

Сравнение Qwen2.5-Max с DeepSeek V3, Llama 3.1-405B и Qwen2.5-1M

Сравнение результатов тестирования Qwen2.5-Max с другими передовыми ИИ DeepSeek V3 и *Llama 3.1-405B, а также предыдущей моделью Alibaba Qwen2.5-1M. Источник: Qwen.

Интересно, что Qwen2.5-Max не является нейросетью в ее классическом понимании. Новую языковую модель можно назвать полноценным “умным помощником”, поскольку при создании Qwen2.5-Max разработчики делали акцент на логическое мышление, которое позволяет “предугадывать” запросы пользователя, предоставляя намного более релевантные ответы. Также китайская ИИ имеет углубленное понимание более чем 100 языков, поэтому ситуации, когда Qwen2.5-Max вас не поймет из-за лингвистического барьера, исключены. К тому же, нейросеть построена на гибкой архитектуре MoE (Mixture-of-Experts), которая позволяет эффективно масштабировать новую модель.

Это лишь малая часть особенностей из целого ряда преимуществ Qwen2.5-Max, которые мы подробно перечислим ниже:

Обработка до 1 млн токенов за запрос. Alibaba удалось увеличить кол-во обрабатываемых токенов за один запрос в 10 раз по сравнению с Qwen2.5-1M. Благодаря этому передовой ИИ Qwen2.5-Max может обрабатывать огромные объемы информации по запросу пользователя, сохраняя крайне высокую релевантность ответов;
Универсальность. Qwen2.5-Max понимает не только текст — модель способна обрабатывать и генерировать видео и изображения, аудиофайлы и даже определяет эмоциональный тон как в тексте, так и в голосовых запросах. Сложность или тип выполняемой задачи для Qwen2.5-Max тоже не является проблемой — модель может писать код, решать математические задачи, проводить анализ, создавать документы с разным форматирование и выполнять другие типы операций;

Изображение центральных процессоров, сгенерированное в Qwen2.5-Max

Пример изображения, сгенерированного с помощью нейросети Qwen2.5-Max.

Вот еще несколько преимуществ новой модели ИИ от китайского разработчика:

Высокая скорость ответа. По сравнению с предыдущей версией Qwen, модель Qwen2.5-Max обучается на 40%, а генерация ответа составляет всего 0,8 секунд. При этом, релевантность ответов возросла на 60%;
Продвинутый ИИ-поиск. Qwen2.5-Max имеет встроенный поиск и может эффективно находить необходимую информацию из открытых источников в интернете, причем, делая это точнее, чем аналогичные модели;
Персонализация. Нейросеть способна изучать запросы пользователя, запоминая его стиль общения, интересующие его тематики, прочие индивидуальные особенности и даже имя, выдавая за счет этого наиболее релевантные ответы;
Строгое соблюдение табу. В отличие от нейросетей DeepSeek V3 и R1, которые при вводе табу-промптов цензурили ответы только после их генерации, Qwen2.5-Max отказывается предоставлять ответы на запрещенные запросы, а обмануть ее с помощью хитрых промптов очень сложно;
Креативные ответы. Qwen2.5-Max хорошо показывает себя даже в креативных задачах — она справляется с генерацией дизайна, составлением бизнес-планов и даже может неплохо шутить, выдавая саркастичные ответы при запросе;

Qwen2.5-Max правильно выделяет элементы сарказма в тексте про свое превосходство над ChatGPT и *Llama.

Продвинутое программирование. По заявлениям пользователей, Qwen2.5-Max не просто может генерировать программный код, а делает это на уровне опытного специалиста уровня senior. С помощью Qwen2.5-Max можно создавать сложнейшие коды, делая это быстрее, чем с помощью ChatGPT.

Несмотря на весь этот внушительный список преимуществ, модель полностью бесплатна и для ее использования не нужно использовать VPN. Китай не раскрывает, сколько было потрачено на разработку Qwen2.5-Max, но с учетом дешевизны разработки DeepSeek V3, вряд ли бюджет сильно превысит стоимость своего китайского конкурента.

Что будет с рынком ИИ дальше?

Невероятные результаты тестирований Qwen2.5-Max и DeepSeek потрясли рынок ИИ, оказав влияние не только на восприятие Китая на мировой арене, но и на котировки акций крупнейших компаний, связанных с разработкой искусственного интеллекта. Скорее всего, в первую очередь такой отклик связан с волнениями инвесторов, поскольку западные компании тратят на разработку своих моделей сотни миллионов долларов, в то время как DeepSeek V3 была создана при бюджете всего в 5 миллиардов долларов. Как Китаю удалось при таком небольшом бюджете и в условиях санкционных ограничений со стороны Запада выпустить языковую модель, которая превзошла решения ведущих ИИ-компаний — пока что неизвестно.

Но эти достижения свидетельствуют о том, что наступило время, когда лидерство США в секторе искусственного интеллекта больше не выглядит таким устойчивым, как раньше. Это подтверждается тем, что компания AMD уже объявила о начале сотрудничества с китайскими разработчиками из DeepSeek, которое будет включать поставку ускорителей Instinct (вероятнее всего MI325X или инновационные APU MI300A). В свою очередь, даже Сэм Альтман и Дженсен Хуанг выразили свое восхищение результатами китайских ИИ, а бывший CEO Intel Пэт Гелсингер поделился, что будет использовать DeepSeek R1 в своем стартапе Gloo. Однако, с учетом выхода Qwen2.5-Max, AMD и Гелсингеру придется пересмотреть свой выбор, и скорее всего он падет именно на сотрудничество с компанией Alibaba.

AMD объявляет о запуске DeepSeek на ИИ-ускорителях семейства Instinct

Объявление от AMD о запуске модели DeepSeek V3 на графических ускорителях Instinct. Источник: AMD.

Выводы

В обзорах китайских CPU мы показали, что в Поднебесной есть очень интересные, перспективные разработки и технологии страны находятся на высоком уровне. Но никто не мог подумать, что КНР так неожиданно ворвется на рынок ИИ, причем, не просто составив конкуренцию лидерам сектора в лице OpenAI и *Meta, а полностью разбив решения этих компаний, не оставляя им и шанса с каждым новым анонсом. Несмотря на это, списывать со счетов OpenAI, *Meta и Google и другие западные ИИ еще рано, ведь сфера искусственного интеллекта продолжает активно развиваться, а серьезная конкуренция со стороны Китая будет только подкреплять стремление к новым достижениям. Вполне возможно, что в ближайшее время бывшие лидеры выпустят свой ответ на Qwen2.5-Max и DeepSeek R1, который восстановит их статус, доверие инвесторов и позиции в рейтинге самых производительных языковых моделей. Но пока этого не произошло, команда ServerFlow будет внимательно следить за разворачивающейся ситуацией на рынке ИИ и оперативно делиться с нашими читателями самыми актуальными новостями этой индустрии.

*LLAMA — проект Meta Platforms Inc., деятельность которой в России признана экстремистской и запрещена

**Деятельность Meta Platforms Inc. в России признана экстремистской и запрещена

Автор:

Serverflow