Google выпустила T5Gemma 2 — обновленную версию LLM семейства T5, ориентированную на мультимодальный вывод с увеличенным контекстным окном. Суть T5Gemma 2 в том, чтобы предоставить пользователям возможность обрабатывать большие объемы данных с текстом и изображениями, используя компактную LLM с минимальными задержками. Модель рассчитана T5Gemma 2 как на исследовательские сценарии, так и на практическое внедрение в прикладные системы.
Подробнее о T5Gemma 2
Главное изменение T5Gemma 2 в сравнении с ванильной Google T5 заключается в модернизации архитектуры трансформера. В модели используются общие (tied) эмбеддинги слов для энкодера и декодера, что уменьшает дублирование параметров и снижает потребление памяти. Кроме того, инженеры Google объединили механизмы self-attention и cross-attention в единый слой, что позволило упростить вычислительный граф и повысить скорость обработки длинных последовательностей без потери качества. Семейство моделей T5Gemma 2 включает три модели — с 270 миллионов параметров, 1 миллиардом параметров и 4 миллиарда параметров. Такой широкий выбор дает возможность использовать модель T5Gemma 2 как на слабом железе с ограниченным объемом памяти, так и в более тяжелых коммерческих пайплайнах. Еще одно важное нововведение — поддержка длинного контекстного окна до 128 000 токенов, благодаря чему новые нейросети Google можно применять для анализа длинных документов, сложных диалогов и комбинированных текстово-графических структур. Модель работает с текстами на 140 языках и способна обрабатывать изображения, обеспечивая полноценное мультимодальное понимание. В ключевых ИИ-бенчмарках модели T5Gemma 2 превзошли топовые нейросети Gemma 3 в задачах, связанных с длинным контекстом, программированием и мультимодальным анализом. Google T5Gemma 2 сумела обеспечить рост точности, в том числе точности следования инструкциям, а также в эффективности рассуждений при работе с большими входными данными.
Релиз T5Gemma 2 демонстрирует стратегический вектор Google и всей индустрии ИИ в целом — создание ИИ-моделей с длинным контекстом, мультимодальной поддержкой и высокой вычислительной эффективностью. В этой перспективе T5Gemma 2 становится важным инструментом для современных ИИ-систем, ориентированных на реальные прикладные задачи, научные исследования и масштабируемые коммерческие решения. T5Gemma 2 уже доступна исследователям и разработчикам на платформах и Kaggle.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.