Компания Microsoft представила новую рассуждающую ИИ-модель Phi-4-mini-flash-reasoning, оптимизированную для выполнения широкого спектра логических операций на мобильных устройствах, периферийных системах и в других средах с ограниченными вычислительными ресурсами. Благодаря применению инновационной гибридной архитектуры SambaY, модель демонстрирует до 10 раз более высокую скорость генерации ответов по сравнению с другими решениями семейства Microsoft Phi и обеспечивает в 2-3 раза меньшую задержку отклика.
Подробнее о Phi-4-mini-flash-reasoning
Phi-4-mini-flash-reasoning является моделью с открытым исходным кодом, имеет 3,8 миллиардов параметров и оптимизирована для выполнения сложных математических задач с использованием функции рассуждения. Размер контекстного окна модели Phi-4-mini-flash-reasoning достигает 64 тысяч токенов, а обучение нейросети выполнялось с использованием высококачественных синтетических данных, что обеспечивает надежное, быстрое и производительное развертывание для выполнения задач, требующих интенсивной логической обработки. Подобно другим моделям линейки Phi, Phi-4-mini-flash-reasoning может быть развернута всего на одной видеокарте.
График, демонстрирующий 10-кратный прирост скорости вывода модели Phi-4-mini-flash-reasoning в сравнении с нейросетью Phi-4-mini-reasoning. Источник: Hugging Face.
Ключевым компонентом архитектуры SambaY выступает Gated Memory Unit (GMU) — простой, но высокоэффективный механизм для обмена информацией между несколькими компонентами модели. Использование модулей GMU значительно повышает эффективность декодирования и ускоряет обработку длинных контекстов. Это обеспечивает высокую производительность в разнообразных сценариях и позволяет существенно ускорить процесс вывода нейросети без снижения качества выполнения логических операций.
Показатели производительности модели Phi-4-mini-flash-reasoning в разных тестах в сравнении с моделями эквивалентного объема. Источник: Hugging Face.
В Microsoft заявляют, что новая модель отлично подойдет для интеграции в платформы адаптивного обучения, где критически важна обратная связь в реальном времени, а также для использования в качестве периферийных агентов, способных к логическому выводу. Кроме того, Phi-4-mini-flash-reasoning будет полезна в интерактивных образовательных системах, динамически подстраивающих сложность контента под успеваемость учащихся. Компания подчеркивает, что выдающаяся эффективность модели в математике и структурированном мышлении делает ее особенно ценной для сферы образовательных технологий (EdTech), простых симуляций и автоматизированных инструментов оценки, требующих надежного вывода с минимальным временем отклика. Модель Microsoft Phi-4-mini-flash-reasoning уже доступна для скачивания на платформе Hugging Face.
Выводы
Microsoft вновь продемонстрировала свою превосходство в области создания компактных, но эффективных нейросетей для систем с ограниченными вычислительными ресурсами. Скорее всего, Phi-4-mini-flash-reasoning будет активно использоваться в ноутбуках и периферийных системах, однако массовый рынок все же продолжит пользоваться не такими компактными, но гораздо более эффективными большими языковыми моделями, вроде DeepSeek R1 или чат-ботами серии GPT.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Получите скидку 3 000 рублей или бесплатную доставку за подписку на новости*!
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.