Google открыла исходный код нового семейства ИИ-моделей TranslateGemma для машинного перевода, разработанного на базе Gemma 3. Все три модели поддерживают 55 языков, включая русский, и ориентированы как для личного, так и коммерческого использования.
Подробнее о TranslateGemma
Семейство TranslateGemma включает модели объемом 4, 12 и 27 миллиардов параметров, благодаря чему систему ИИ-перевода можно локально развернуть как на слабых, так и на более продвинутых устройствах. Модель с 4 миллиардами параметров оптимизирована для запуска на мобильных устройствах, тогда как 12-миллиардная версия рассчитана на потребительские ноутбуки и рабочие станции. Самая большая модель TranslateGemma с 27 миллиардами параметров для развертывания требует наличия ИИ-ускорителя уровня Nvidia H100, либо ее также можно развернуть на облачных мощностях. По данным Google, версия с 12 миллиардами параметров превосходит базовую Gemma 3 с 27 миллиардами параметров на бенчмарке WMT24++, демонстрируя более высокое качество перевода при существенно меньших вычислительных затратах. Это делает модель особенно привлекательной для систем, где критичны высокая пропускная способность и минимальная задержка. Дополнительное тестирование на бенчмарке Vistra показало, что TranslateGemma демонстрирует улучшенные результаты при переводе текста в изображений, несмотря на то, что модель не проходила специализированного дообучения для задач мультимодального перевода.
Высокая эффективность TranslateGemma достигнута за счет двухэтапного процесса обучения. На первом этапе использовалось дообучение с учителем, в рамках которого модели Gemma 3 обучались на смешанном корпусе данных, включающем переводы, выполненные людьми, а также высококачественные синтетические данные, сгенерированные облачными моделями семейства Google Gemini. На втором этапе применялось RL-обучение, где использовались продвинутые метрики качества, такие как MetricX-QE и AutoMQM, благодаря чему естественность и контекстуальная точность переводов значительно увеличилась.
TranslateGemma расширяет экосистему открытых моделей Google, предлагая разработчикам мощный и гибкий инструмент машинного перевода с поддержкой десятков языков и различными требованиями к вычислительным ресурсам. Сочетание высокой точности, масштабируемости и открытых весов делает TranslateGemma значимым релизом для открытого сообщества и усиливает конкуренцию в сегменте ИИ-перевода, где open-source модели все активнее приближаются по качеству к проприетарным решениям.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.