Top.Mail.Ru
SpikingBrain-1.0: китайская ИИ-модель, работающая как мозг | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Distribution of
Server Components
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

SpikingBrain-1.0: китайская ИИ-модель, работающая как мозг

~ 2 мин
14
Простой
Новости
SpikingBrain-1.0: китайская ИИ-модель, работающая как мозг

Введение

Китайские исследователи создали инновационную систему искусственного интеллекта SpikingBrain-1.0, которая воспроизводит принципы работы нейронных сетей человеческого мозга. Новейшая технология позволит создавать энергоэффективные вычислительные системы будущего. 

Подробнее о SpikingBrain-1.0

Ученые из Института автоматизации Китайской академии наук, ответственные за разработку масштабной генеративной ИИ-модели SpikingBrain-1.0, заявляют, что решение обучено только на отечественных GPU, предположительно, от компании Huawei. В отличие от популярных генеративных ИИ-систем, использующих ресурсоемкую архитектуру трансформеров, новая платформа реализует принципиально иной подход, где интеллект является следствием импульсной активности нейронов — нейросеть передает данные с помощью импульсов, имитируя принцип передачи сигналов биологических нейронов человеческого головного мозга. Благодаря этой инновационной технологии, модель SpikingBrain-1.0 демонстрирует высокую скорость обучения при использовании крайне малых объемов данных — всего около 2% от объемов, требуемых для предварительного обучения крупным базовым языковым моделям. Китайские специалисты заявляют, что в будущем SpikingBrain-1.0 сможет обучаться в 100 раз быстрее традиционных нейросетей. Несмотря на это, система показывает сопоставимую производительность с открытыми аналогами в задачах понимания языка и логических рассуждений. 

Схема работы SpikingBrain
Схема работы ИИ-модели SpikingBrain. Источник: GitHub.

Помимо этого, благодаря использованию технологии событийно-управляемых спайковых нейронов на этапе инференса, одна из конфигураций SpikingBrain смогла продемонстрировать 26,5-кратное ускорение логического вывода по сравнению с решениями на архитектуре трансформеров при генерации первого токена из контекста объемом в миллион токенов. Способность модели обрабатывать сверхдлинные последовательности обеспечивает значительное преимущество в эффективности для таких сценариев, как анализ юридической и медицинской документации, эксперименты в физике и энергетике, а также обработка геномных данных. 

Выводы

Исследовательская группа уже открыла доступ к исходному коду модели на GitHub и запустила публичную тестовую платформу, а также опубликовала крупномасштабный технический отчет, прошедший независимую верификацию. Ранее ученые из этого же института совместно со швейцарскими коллегами создали энергоэффективный нейроморфный чип Speck для сенсорной обработки и вычислений, который потребляет всего 0,42 милливатта — меньше энергии, чем требует человеческий мозг. Похоже, что ИИ-индустрия вступает в новую эпоху, где балом правят систему, имитирующие работу биологических нейронных сетей.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-19:00 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-19:00 (по МСК)