Google DeepMind представила Gemini 2.5 Computer Use — агента искусственного интеллекта, способного самостоятельно взаимодействовать с пользовательскими интерфейсами. Агент уже продемонстрировал высочайшую эффективность в тестах и в будущем Gemini 2.5 Computer Use может быть интегрирован в инструментарий браузера Google.
Подробнее о Gemini 2.5 Computer Use
Gemini 2.5 Computer Use может напрямую выполнять различные действия в интерфейсах веб-сайтов и приложений, например, писать текст, делать клики, заполнять формы, переносить информацию между различными сервисами и упорядочивать элементы на рабочих досках. и т.д.. Агент уже стал доступен разработчикам через Gemini API и облачную платформу Vertex AI, а для широкой аудитории Google запустила публичную демоверсию на платформе Browserbase. Принцип работы агента построен на циклическом процессе. Сначала ИИ анализирует снимок экрана, учитывает историю предыдущих операций и получаемую задачу, после чего планирует действие. Клиентская система выполняет это действие и создает новый скриншот. Цикл повторяется до полного решения поставленной задачи. За эту функциональность отвечает новый инструмент computer_use, встроенный в API Gemini. В настоящее время агент ориентирован на работу в браузерах — в Google отмечают, что для управления интерфейсами на уровне операционной системы компьютера он пока не адаптирован, но это будет исправлено в ближайшем будущем. Компания также заявляет, что агент работает с реальными веб-страницами, в том числе с теми, что находятся за системой аутентификации, что создает возможности для автоматизации корпоративных интерфейсов и стандартных офисных процессов.
Выводы
На данный момент Computer Use находится на стадии публичного превью. В Google предупреждают, что основной фокус смещен на обеспечение стабильной работы в браузере и безопасность: каждое действие модели проходит проверку на стороне сервера, определенные операции (например, совершение покупок) требуют подтверждения пользователя, а потенциально рискованные сценарии (обход капчи, вмешательство в работу устройств) блокируются. Планы по дальнейшему развитию новинки пока не раскрываются, но уже можно предположить, что компания внедрит агента в свой браузер Google Chrome в формате платного расширения.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Скидка 1 500 ₽ или бесплатная доставка - уже сейчас 🔥
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.
При оформлении заказа в ServerFlow вы можете сообщить о намерении оставить отзыв о нашей работе после получения товара.
Нам важно ваше честное мнение. Оно помогает развивать сервис и даёт другим клиентам представление о нашей работе.
Вы можете оставить отзыв на удобной для вас платформе:
Google Maps
2GIS
Яндекс Карты
Как работает акция
Применяя промокод, вы подтверждаете намерение поделиться впечатлением о работе ServerFlow после получения заказа. Мы применяем бонус уже к текущему заказу в знак благодарности за обратную связь.
Условия акции:
скидка 1 500 ₽ при заказе от 30 000 ₽
или бесплатная доставка* при заказе до 30 000 ₽
* Бесплатная доставка заказа осуществляется до ПВЗ СДЭК.