Компания Google, которая выпускает языковые модели серии Gemma, загрузила в открытый доступ новую версию передового искусственного интеллекта Gemma 3. Эта нейросеть поддерживает 140 языков, может генерировать и анализировать текст, создавать изображения или даже короткие видео, при этом, запустить Gemma 3 можно всего на 1 видеокарте.
Что нового в Gemma 3?
Google смело заявила, что Gemma 3 — это лучшая нейросеть среди моделей, которые можно запустить всего на одном GPU. При этом, по заявлениям разработчиков, Gemma 3 обходит квантизированные решения таких ИИ-гигантов, как Meta*, DeepSeek и OpenAI. Для обучения и инференса Gemma 3 можно использовать не только ускорители от Nvidia, но решениях от сторонних производителей ИИ-оборудования. Одним из главных нововведений Gemma 3 стало улучшение функции анализа видеороликов — теперь в нейросеть можно загружать видеоматериалы в высоком разрешении, при этом, форма кадра может быть абсолютно любой. Также улучшили функции безопасности — специальный фильтр ShieldGemma 2 будет отказываться от генерации или анализа медиа, содержащих жесткий или интимный контент. Кроме того, этот защитный механизм также препятствует генерации текстовых материалов с незаконной информацией. Длина контекстного окна модели была увеличена до 128 000 токенов, что позволяет использовать нейросеть в таких сложных задачах, как научные исследования или генерация программного кода. Gemma 3 уже доступна для скачивания на таких фреймворках, как Ollama и Hugging Face, доступны версии с с 1, 4, 12 и 27 миллиардами параметров. Кроме того, в отличие от решений от OpenAI, Gemma 3 доступна для использования во всех странах мира.
Производительность Gemma 3 в сравнении с другими моделями ИИ по шкале оценки Chatbot Arena Elo. Источник: .
Выводы
Гонка за лидерство в нише искусственного интеллекта продолжается и компании продолжают выпускать свои передовые нейросети, причем, весьма регулярно. Google тоже участвует в этой гонке и не отстает от конкурентов, расширяя ассортимент локальных ИИ, которые можно запускать и обучать на системах среднего уровня. Не исключено, что в ближайшее время Google анонсирует выход еще одной версии своей серии мультимодальных моделей Gemini, оптимизированных для решения более сложных типов операций.
*LLAMA — проект Meta Platforms Inc.**, деятельность которой в России признана экстремистской и запрещена
**Деятельность Meta Platforms Inc. в России признана экстремистской и запрещена
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.