Одна из крупнейших китайских компаний Tencent представила новое поколение нейросетей с открытым исходным кодом семейства Hunyuan-MT, специализирующихся на выполнении машинного перевода — Hunyuan-MT-7B и Hunyuan-MT-Chimera-7B. По заявлениям Tencent, новинки демонстрируют высочайшую точность при своих компактных размерах.
Подробнее о Hunyuan-MT-7B и Hunyuan-MT-Chimera-7B
Нейросети Hunyuan-MT-7B и Hunyuan-MT-Chimera-7B поддерживают до 33 трех наиболее распространенных языков, включая русский, английский, китайский, мандаринский, чешский, немецкий, японский и другие. Это может показаться весьма скромным показателем, однако это объясняется скромным объемом в 7 миллиардов параметров и оптимизацией для высочайшей точности перевода на доступные языки. Примечательно, что Hunyuan-MT-7B является стандартной моделью машинного перевода, тогда как Hunyuan-MT-Chimera-7B представляет собой первую в индустрии открытую ансамблевую модель, которая объединяет несколько подходов к выполнению перевода. Несмотря на недавний выход, модели Hunyuan-MT-7B и Hunyuan-MT-Chimera-7B смогли занять первое место в 30 из 31 категорий в международном конкурсе WMT25 (Workshop on Machine Translation 2025) по машинному переводу. Обе нейросети уже доступны на Hugging Face в базовом и квантизированном варианте (FP8).
Результаты тестирования моделей Hunyuan-MT-7B и Hunyuan-MT-Chimera-7B. Источник: .
Выводы
Компания Tencent вновь смогла внести свой вклад в развитие индустрии open-source перевода. С учетом того, что передовые модели Hunyuan-MT сумели стать лучшими нейросетями для машинного перевода в классе компактных ИИ, можно с уверенностью сказать, что у Tencent есть огромный потенциал на выпуск еще более революционных нейросетей. А благодаря поддержке десятков языков, передовым архитектурным решениям и небольшому объему параметров, модели Hunyuan-MT станут отличным решением для повсеместного внедрения систем машинного перевода.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.