Компания Microsoft представила новую рассуждающую ИИ-модель Phi-4-mini-flash-reasoning, оптимизированную для выполнения широкого спектра логических операций на мобильных устройствах, периферийных системах и в других средах с ограниченными вычислительными ресурсами. Благодаря применению инновационной гибридной архитектуры SambaY, модель демонстрирует до 10 раз более высокую скорость генерации ответов по сравнению с другими решениями семейства Microsoft Phi и обеспечивает в 2-3 раза меньшую задержку отклика.
Подробнее о Phi-4-mini-flash-reasoning
Phi-4-mini-flash-reasoning является моделью с открытым исходным кодом, имеет 3,8 миллиардов параметров и оптимизирована для выполнения сложных математических задач с использованием функции рассуждения. Размер контекстного окна модели Phi-4-mini-flash-reasoning достигает 64 тысяч токенов, а обучение нейросети выполнялось с использованием высококачественных синтетических данных, что обеспечивает надежное, быстрое и производительное развертывание для выполнения задач, требующих интенсивной логической обработки. Подобно другим моделям линейки Phi, Phi-4-mini-flash-reasoning может быть развернута всего на одной видеокарте.
График, демонстрирующий 10-кратный прирост скорости вывода модели Phi-4-mini-flash-reasoning в сравнении с нейросетью Phi-4-mini-reasoning. Источник: .
Ключевым компонентом архитектуры SambaY выступает Gated Memory Unit (GMU) — простой, но высокоэффективный механизм для обмена информацией между несколькими компонентами модели. Использование модулей GMU значительно повышает эффективность декодирования и ускоряет обработку длинных контекстов. Это обеспечивает высокую производительность в разнообразных сценариях и позволяет существенно ускорить процесс вывода нейросети без снижения качества выполнения логических операций.
Показатели производительности модели Phi-4-mini-flash-reasoning в разных тестах в сравнении с моделями эквивалентного объема. Источник: .
В Microsoft заявляют, что новая модель отлично подойдет для интеграции в платформы адаптивного обучения, где критически важна обратная связь в реальном времени, а также для использования в качестве периферийных агентов, способных к логическому выводу. Кроме того, Phi-4-mini-flash-reasoning будет полезна в интерактивных образовательных системах, динамически подстраивающих сложность контента под успеваемость учащихся. Компания подчеркивает, что выдающаяся эффективность модели в математике и структурированном мышлении делает ее особенно ценной для сферы образовательных технологий (EdTech), простых симуляций и автоматизированных инструментов оценки, требующих надежного вывода с минимальным временем отклика. Модель Microsoft Phi-4-mini-flash-reasoning уже доступна для скачивания на платформе Hugging Face.
Выводы
Microsoft вновь продемонстрировала свою превосходство в области создания компактных, но эффективных нейросетей для систем с ограниченными вычислительными ресурсами. Скорее всего, Phi-4-mini-flash-reasoning будет активно использоваться в ноутбуках и периферийных системах, однако массовый рынок все же продолжит пользоваться не такими компактными, но гораздо более эффективными большими языковыми моделями, вроде DeepSeek R1 или чат-ботами серии GPT.
Надо смотреть как реально часто будут пользоваться, все графики в стерильных условиях де-факто не имеют отношения к реальной юзабельности
Serverflow
Вы по другому и не увидите показатели, пока она массово не войдет в использование! Мы можем ориентироваться на заявленные графики, но, конечно же, в реальных условиях они могут отличаться, как появятся массовые отзывы и тесты может напишем про них отдельно :)
Скидка 3 000 ₽ или бесплатная доставка — уже сейчас 🔥
Мы ценим вашу обратную связь. После покупки оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены.
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.