Что там опять 07.12.2023

Google представил Gemini — крупнейшую модель искусственного интеллекта

Она может обобщать и понимать, обрабатывать и комбинировать различные типы информации, включая текст, код, аудио, изображения и видео.

Сундар Пичаи, генеральный директор Google и Alphabet, представил Gemini: по его мнению, самую функциональную и универсальную модель искусственного интеллекта.

Gemini — результат совместной работы разных команд Google. Модель является мультимодальной. Она может обобщать и понимать, обрабатывать и комбинировать различные типы информации, включая текст, код, аудио, изображения и видео.

Gemini также является гибкой моделью, поскольку может работать на любых устройствах — от дата‑центров до мобильных гаджетов. Первая версия Gemini 1.0 будет оптимизирована для трёх целей:

Gemini Ultra — для решения сложных задач;
Gemini Pro — для масштабирования под широкий круг задач;
Gemini Nano — для решения задач на мобильных устройствах.

Какие результаты показал Gemini при тестировании

Производительность Gemini Ultra превосходит текущие результаты по 30 из 32 академических тестов, которые применяют в исследованиях и разработках больших языковых моделей. Также она превзошла живых людей в тесте MMLU, который содержит экзамены по 57 предметам: математике, физике, истории, праву, медицине, этике. Результат Gemini Ultra — 90,0%. Таких результатов ранее не достигала ни одна модель.

gemini-final-text-table-bigger-font-amendment-lines — Результаты тестирования Gemini. Источник: блог Google

Возможности нового поколения ИИ

Стандартный подход к созданию мультимодальных моделей включал обучение отдельных компонентов для различных модальностей, которые далее объединяли. Они хорошо справлялись с определёнными задачами, — например, могли описать изображение, — но испытывали трудности с концептуальным и сложным рассуждением.

Gemini обладает нативной мультимодальностью. Это помогает ей разбираться в сложной письменной и визуальной информации и делает модель уникальной — она может находить конкретные сведения среди огромных объёмов данных. Например, может извлечь необходимую информацию из сотен тысяч документов посредством чтения, фильтрации и понимания данных.

Также Gemini 1.0 была обучена одновременно распознавать и понимать текст, изображения, аудио и многое другое. Благодаря этому модель лучше понимает тонкости информации, контекст, может отвечать на сложные вопросы.

Команды обучали Gemini 1.0 в оптимизированной для искусственного интеллекта инфраструктуре с использованием Tensor Processing Units (TPUs) v4 и v5e. Благодаря этому Gemini работает значительно быстрее, чем более ранние модели.

Gemini и программирование

Gemini способна понимать, объяснять и генерировать высококачественный код на популярных языках программирования: Python, Java, C++ и Go.

Она также может использоваться в качестве движка для продвинутых систем программирования. Например, два года назад Google представил AlphaCode, систему генерации кода на базе ИИ. Теперь, используя Gemini, компания выпустила улучшенную версию AlphaCode 2. Эта версия решает задачи соревновательного программирования, которые выходят за рамки кодирования, включают сложные математические и теоретические задачи по информатике.

Когда релиз?

С 6 декабря Bard будет использовать доработанную версию Gemini Pro. Это самое большое обновление чат‑бота с момента его запуска. Обновление будет развёрнуто на английском языке в более чем 170 странах.

В ближайшие месяцы Gemini будет доступен в продуктах и сервисах Google: Поиск, Ads, Chrome и Duet AI. Google уже начал экспериментировать с Gemini в Поиске. Модель ускоряет SGE и улучшает качество ответов.

С 13 декабря разработчики и корпоративные клиенты смогут получить доступ к Gemini Pro через Gemini API в Google AI Studio или Google Cloud Vertex AI. Разработчики Android также смогут использовать Gemini Nano через AICore.

Gemini Ultra станет доступной для избранных клиентов, разработчиков, партнёров и экспертов по безопасности в рамках раннего экспериментирования. В начале следующего года будет запущен Bard Advanced — новая технология искусственного интеллекта, которая предоставит доступ к Gemini Ultra.

В наших новостях всегда есть немного больше, чем у других. Подпишитесь на канал в Телеграм и читайте интересные новости первыми.

Теги:

#google