Google анонсировала появление Gemini — модели искусственного интеллекта, задуманной как альтернатива ChatGPT. Позиционируясь для превзойдения GPT-4 в разных испытаниях, Gemini стала значительным шагом в развитии ИИ, согласно заявлениям главы Google Сундара Пичаи. Ожидается, что её выпуск 13 декабря существенно повлияет на ассортимент продуктов компании.
Разнообразные Варианты: Gemini Nano, Pro и Ultra
Под общим названием Gemini Google представила несколько моделей ИИ. Перед предстоящим запуском Gemini Pro, предназначенной для различных сервисов Google, включая чат-бота Bard, появилась Gemini Nano, специализированная для устройств на базе Android. Gemini Ultra, объявленная самой мощной моделью LLM от Google, представляет интерес для использования в центрах обработки данных и корпоративных приложений.
Детали Выпуска и Доступ
Выход Gemini, Pro и Nano запланирован на 13 декабря. Доступ к модели Pro будет предоставлен через чат-бота Bard, а разработчики и корпоративные пользователи смогут пользоваться Google Generative AI Studio или Vertex AI на облачной платформе Google Cloud. Стоит отметить, что версия Bard на базе Pro не будет доступна в Великобритании и Швейцарии из-за координационных задержек. Ultra находится на стадии тестирования и ожидается только в 2024 году, возможно, с интеграцией в усовершенствованную версию Bard под названием Bard Advanced.
Расширение и Интеграция
Начально доступная только на английском языке, модель Gemini Google планирует поддержку других языков в будущем. По заявлению Пичаи, Gemini будет интегрирована в поисковую систему Google, рекламные продукты, браузер Chrome и прочие приложения.
Мультимодальные Возможности и Эффективность
Gemini обладает мультимодальными способностями и успешно обрабатывает текст, аудио, изображения, видео и код. Тесты Google показали превосходство Ultra над GPT-4 в 30 из 32 испытаний производительности, включая рассуждения и распознавание изображений. Кроме того, модель Pro превзошла GPT-3.5 в шести из восьми тестов.
Вехи и Перспективы Развития
Ultra достигла важного успеха, превзойдя человека в многофункциональном тесте MMLU, охватывающем предметы от математики до этики. Её интеграция в AlphaCode2, предположительно превосходящий в тестах 85% человеческих программистов, является значительным достижением.
Уникальные Преимущества и Перспективы Роста
Основное преимущество модели Gemini заключается в её мультимодальности, что отличает её от других моделей, специализирующихся на распознавании речи или изображений. Google обещает постоянные улучшения в восприятии Gemini с целью глубокого понимания и повышенной точности.