Компания Google представила новую ИИ-архитектуру под названием Titan, которая призвана сместить с престола систему моделей трансформеров. Дело в том, что архитектура “внимания” уже практически изжила себя и столкнулась с фундаментальными ограничениями, поэтому ИИ-индустрия ждет нового прорыва, который сменит парадигму и устранит проблемы квадратичной сложности вычисления токенов, ограниченного контекстного окна и высоких системных требований.
Подробнее о Google Titan
Google Titan предлагает решение всех проблем современных LLM. Пока классические трансформеры начинают снижать точность уже на уровне примерно 4000 токенов, новая архитектура Google уверенно работает с последовательностями свыше двух 2 миллионов токенов и при этом не теряет качества. Вместо стандартного механизма внимания, исследователи Google внедрили в архитектуру Titan сразу 3 вида памяти: краткосрочную, долгосрочную и постоянную. Краткосрочная (Memory as Context) по-прежнему основана на attention и отвечает за последние фрагменты контекста. Долгосрочная (Memory as Gating) хранит важные элементы, накапливающиеся по ходу обработки данных и обновляемые прямо во время инференса. Постоянная (Memory as Layer) выступает в роли устойчивого фундамента, куда попадают ключевые сведения, не зависящие от конкретного ввода.
Схема работы трех видов памяти архитектуры Google Titan. Источник: .
Экспериментальную ИИ-модель на базе Titan научили оценивать, какие данные запомнить, с помощью метода “сюрприза”: чем неожиданнее токен для нейросети, тем выше его приоритет для сохранения. Долгосрочная память также имеет механизм затухания, позволяющий постепенно забывать устаревшие данные. При этом вся архитектура остается масштабируемой.
Google Titan обходит топовые ИИ-модели по размеру контекстного окна. Источник: .
Google испытали три варианта соединения модулей памяти. Лучшую точность продемонстрировал подход MAC, в котором долгосрочная память используется как целенаправленно отобранный контекст для внимания, а самым быстрым стал MAL — последовательная интеграция памяти в слой. В итоге Titan получился одновременно точнее и экономичнее трансформеров при работе с огромными входными данными, обеспечивая стабильную обработку контекста вплоть до двух миллионов токенов и требуя при этом заметно меньше вычислительных операций.
Выводы
Titan пока не позиционируется как окончательная замена трансформерам, но впервые за много лет появилась архитектура, которая может действительно прекратить доминирование классической модели внимания и достойно выдерживает конкуренцию в сравнении с другими альтернативными ИИ-архитектурами. Если разработка найдет широкое применение, будущее LLM может выглядеть совсем иначе — с огромными контекстами, устойчивой памятью и куда более глубоким пониманием длинных последовательностей.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Скидка 1 500 ₽ или бесплатная доставка - уже сейчас 🔥
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.
При оформлении заказа в ServerFlow вы можете сообщить о намерении оставить отзыв о нашей работе после получения товара.
Нам важно ваше честное мнение. Оно помогает развивать сервис и даёт другим клиентам представление о нашей работе.
Вы можете оставить отзыв на удобной для вас платформе:
Google Maps
2GIS
Яндекс Карты
Как работает акция
Применяя промокод, вы подтверждаете намерение поделиться впечатлением о работе ServerFlow после получения заказа. Мы применяем бонус уже к текущему заказу в знак благодарности за обратную связь.
Условия акции:
скидка 1 500 ₽ при заказе от 30 000 ₽
или бесплатная доставка* при заказе до 30 000 ₽
* Бесплатная доставка заказа осуществляется до ПВЗ СДЭК.