Top.Mail.Ru
VibeThinker-1.5B: микро-модель на уровне GPT-OSS-20b | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Скидка
за отзыв!
Из-за нестабильности цен RAM фактическая стоимость может отличаться. Цена подтверждается после оформления заказа, работаем над обновлением цен!
Distribution of
Server Components
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

VibeThinker-1.5B: микро-модель на уровне GPT-OSS-20b

~ 2 мин
165
Простой
Новости
VibeThinker-1.5B: микро-модель на уровне GPT-OSS-20b

Введение

На Hugging Face появилась модель VibeThinker-1.5B от стартапа WeiboAI, и сразу вырвалась в топы самых популярных LLM на площадке. При своих по-настоящему миниатюрных размерах в 1,5 миллиарда параметров, нейросеть демонстрирует производительность на уровне более крупных ИИ-моделей, например, GPT OSS-20B Medium. При этом VibeThinker была разработана как экспериментальная система для изучения мыслительных возможностей малых архитектур, а на ее обучение было потрачено всего $7800. Особый акцент сделан на математических задачах и соревновательном программировании, где модель показывает особенно высокую эффективность.

Подробнее о VibeThinker-1.5B

VibeThinker-1.5B показывает впечатляющие результаты в математике. На трех ключевых тестах. В AIME24, AIME25 и HMMT25 она достигает показателей 80,3, 74,4 и 50,4 балла соответственно. Эти значения превосходят показатели модели DeepSeek R1, которая имеет в 400 раз большим числом параметров, чем VibeThinker-1.5B, и набирает лишь 79,8, 70,0 и 41,7 балла. Такой контраст подчеркивает, что компактные модели при правильном обучении способны конкурировать с намного более крупными архитектурами. В области генерации кода VibeThinker-1.5B демонстрирует аналогичную эффективность. В LiveCodeBench v5 она получает 55,9 балла, а в LiveCodeBench v6 — 51,1. Результаты VibeThinker-1.5B опережают более крупную модель Magistral Medium, что демонстрирует способности компактой нейросети в задачах логического вывода в программирования.

Производительность VibeThinker-1.5B
Производительность компактной модели VibeThinker-1.5B. Источник: Hugging Face.

Секрет такой выдающейся производительности заключается в использовании особого метода обучения “спектр-в-сигнал” (SSP). На этапе обучения с учителем система осваивает разнообразные решения задач, формируя широкий спектр возможных подходов для выполнения операции. Затем, на этапе обучения с подкреплением, модель оптимизирует свое поведение, усиливая наиболее надежные и корректные стратегии решения задачи. Взаимодополнение этих процессов обеспечивает высокую производительность, недостижимую в рамках традиционных схем обучения.

Схема обучения VibeThinker-1.5B
Схема обучения VibeThinker-1.5B. Источник: Hugging Face.

Разработчики рекомендуют использовать VibeThinker-1.5B для выполнения математических задач и соревновательного программирования. При этом наилучшие результаты достигаются только при взаимодействии на английском языке, что связано со спецификой обучающего корпуса. Для остальных типов задач модель пока рассматривается как экспериментальная и предназначенная в первую очередь для исследований компактных ИИ-моделей.

Выводы

VibeThinker-1.5B демонстрирует, что даже небольшие модели способны достигать выдающихся результатов, если архитектура и обучающие методики оптимизированы под конкретные типы операций. Ее производительность в математике и генерации кода сопоставима с возможностями значительно более крупных систем, а инновационный подход SSP показывает, что разнообразие решений во время обучения может служить основой высокой точности рассуждений.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-18:30 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-18:30 (по МСК)