Top.Mail.Ru
Microsoft представила Phi-4-mini-flash-reasoning с 10-кратным приростом скорости вывода | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Distribution of
Server Components
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

Microsoft представила Phi-4-mini-flash-reasoning с 10-кратным приростом скорости вывода

~ 2 мин
16
Простой
Новости
Microsoft представила Phi-4-mini-flash-reasoning с 10-кратным приростом скорости вывода

Введение

Компания Microsoft представила новую рассуждающую ИИ-модель Phi-4-mini-flash-reasoning, оптимизированную для выполнения широкого спектра логических операций на мобильных устройствах, периферийных системах и в других средах с ограниченными вычислительными ресурсами. Благодаря применению инновационной гибридной архитектуры SambaY, модель демонстрирует до 10 раз более высокую скорость генерации ответов по сравнению с другими решениями семейства Microsoft Phi и обеспечивает в 2-3 раза меньшую задержку отклика.

Подробнее о Phi-4-mini-flash-reasoning

Phi-4-mini-flash-reasoning является моделью с открытым исходным кодом, имеет 3,8 миллиардов параметров и оптимизирована для выполнения сложных математических задач с использованием функции рассуждения. Размер контекстного окна модели Phi-4-mini-flash-reasoning достигает 64 тысяч токенов, а обучение нейросети выполнялось с использованием высококачественных синтетических данных, что обеспечивает надежное, быстрое и производительное развертывание для выполнения задач, требующих интенсивной логической обработки. Подобно другим моделям линейки Phi, Phi-4-mini-flash-reasoning может быть развернута всего на одной видеокарте.

Прирост скорости вывода модели Phi-4-mini-flash
График, демонстрирующий 10-кратный прирост скорости вывода модели Phi-4-mini-flash-reasoning в сравнении с нейросетью Phi-4-mini-reasoning. Источник: Hugging Face.

Ключевым компонентом архитектуры SambaY выступает Gated Memory Unit (GMU) — простой, но высокоэффективный механизм для обмена информацией между несколькими компонентами модели. Использование модулей GMU значительно повышает эффективность декодирования и ускоряет обработку длинных контекстов. Это обеспечивает высокую производительность в разнообразных сценариях и позволяет существенно ускорить процесс вывода нейросети без снижения качества выполнения логических операций.

Производительность Phi-4-mini-flash-reasoning
Показатели производительности модели Phi-4-mini-flash-reasoning в разных тестах в сравнении с моделями эквивалентного объема. Источник: Hugging Face.

В Microsoft заявляют, что новая модель отлично подойдет для интеграции в платформы адаптивного обучения, где критически важна обратная связь в реальном времени, а также для использования в качестве периферийных агентов, способных к логическому выводу. Кроме того, Phi-4-mini-flash-reasoning будет полезна в интерактивных образовательных системах, динамически подстраивающих сложность контента под успеваемость учащихся. Компания подчеркивает, что выдающаяся эффективность модели в математике и структурированном мышлении делает ее особенно ценной для сферы образовательных технологий (EdTech), простых симуляций и автоматизированных инструментов оценки, требующих надежного вывода с минимальным временем отклика. Модель Microsoft Phi-4-mini-flash-reasoning уже доступна для скачивания на платформе Hugging Face.

Выводы

Microsoft вновь продемонстрировала свою превосходство в области создания компактных, но эффективных нейросетей для систем с ограниченными вычислительными ресурсами. Скорее всего, Phi-4-mini-flash-reasoning будет активно использоваться в ноутбуках и периферийных системах, однако массовый рынок все же продолжит пользоваться не такими компактными, но гораздо более эффективными большими языковыми моделями, вроде DeepSeek R1 или чат-ботами серии GPT.

Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-19:00 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-19:00 (по МСК)