Llama* Nemotron — новое поколение LLM с регулируемым режимом размышления
Автор: ServerFlow
Llama* Nemotron — нейросети для создания нового поколения ИИ-агентов.
Введение
Компания Nvidia анонсировало выход семейства больших языковых моделей Llama* Nemotron, предназначенных для разработки новейших моделей ИИ-агентов, адаптированных как под автономную, так и командную работу. Главное нововведение Llama* Nemotron — возможность регулирования уровня интеллекта с помощью отключения или включения режима рассуждения.
Особенности Llama* Nemotron
В семейство новых LLM вошли модели Nano, Super и Ultra, предназначенные для выполнения широкого спектра операций — от пользовательских задач до вычислений в рамках передовых дата-центров. Все нейросети семейства Llama* Nemotron прошли дополнительное обучение, благодаря чему их производительность возросла на 20%, а вывод ускорился в 5 раз в сравнении с аналогичными ИИ на архитектуре Llama* от компании Meta*, выложенные в открытый доступ. Дообучение моделей проходило с помощью сервиса NVIDIA DGX Cloud при использовании 360 тысяч часов инференса с на базе ускорителей Nvidia H100. Также для оптимизации функции рассуждения обучение моделей курировалось специалистами на протяжении 45 тысяч часов. В данный момент новые ИИ доступны в сервисах Nvidia NIM, однако, компания заявила, что впоследствии Nano, Super и Ultra появятся в открытом доступе.
Выводы
Помимо вышеперечисленного, Nvidia также поделилась информацией, что новые модели Llama* Nemotron уже активно используются рядом компании для разработки более совершенных ИИ-агентов. К примеру, IT-гигант Microsoft активно внедряет Nemotron и микросервисы NIM в облачную экосистему Microsoft Azure, а SAP SE использует модели Llama* Nemotron для увеличения производительности собственного ИИ-помощника Joule. Не исключено, что новые LLM на архитектуре Llama* станут основой для большинства умных помощников, выпускаемых крупными партнерами Nvidia.
*LLAMA — проект Meta Platforms Inc.**, деятельность которой в России признана экстремистской и запрещена
**Деятельность Meta Platforms Inc. в России признана экстремистской и запрещена
Llama* Nemotron — новое поколение LLM с регулируемым режимом размышления
Компания Nvidia анонсировало выход семейства больших языковых моделей Llama* Nemotron, предназначенных для разработки новейших моделей ИИ-агентов, адаптированных как под автономную, так и командную работу. Главное нововведение Llama* Nemotron — возможность регулирования уровня интеллекта с помощью отключения или включения режима рассуждения.
Особенности Llama* Nemotron
В семейство новых LLM вошли модели Nano, Super и Ultra, предназначенные для выполнения широкого спектра операций — от пользовательских задач до вычислений в рамках передовых дата-центров. Все нейросети семейства Llama* Nemotron прошли дополнительное обучение, благодаря чему их производительность возросла на 20%, а вывод ускорился в 5 раз в сравнении с аналогичными ИИ на архитектуре Llama* от компании Meta*, выложенные в открытый доступ. Дообучение моделей проходило с помощью сервиса NVIDIA DGX Cloud при использовании 360 тысяч часов инференса с на базе ускорителей Nvidia H100. Также для оптимизации функции рассуждения обучение моделей курировалось специалистами на протяжении 45 тысяч часов. В данный момент новые ИИ доступны в сервисах Nvidia NIM, однако, компания заявила, что впоследствии Nano, Super и Ultra появятся в открытом доступе.
Выводы
Помимо вышеперечисленного, Nvidia также поделилась информацией, что новые модели Llama* Nemotron уже активно используются рядом компании для разработки более совершенных ИИ-агентов. К примеру, IT-гигант Microsoft активно внедряет Nemotron и микросервисы NIM в облачную экосистему Microsoft Azure, а SAP SE использует модели Llama* Nemotron для увеличения производительности собственного ИИ-помощника Joule. Не исключено, что новые LLM на архитектуре Llama* станут основой для большинства умных помощников, выпускаемых крупными партнерами Nvidia.
*LLAMA — проект Meta Platforms Inc.**, деятельность которой в России признана экстремистской и запрещена
**Деятельность Meta Platforms Inc. в России признана экстремистской и запрещена
Круто, что можно настраивать «мышление» модели! Как будто ИИ учится подстраиваться под задачи, а не наоборот.
Иван Д.
26.03.2025
Думаю всем очевидно, что будущее за рассуждающим ИИ
Serverflow
Вопрос еще в том, как быстро этот ИИ будет рассуждать. Людям часто важна скорость, и если ответы с рассуждением не станут мгновенными, то могут и не сыскать такой популярности.
Получите скидку 3 000 рублей или бесплатную доставку за подписку на новости*!
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.