xAI Илона Маска представила мультимодальную модель Grok-1.5V
Конкурент OpenAI — компания xAI Илона Маска — представила свою первую мультимодальную модель Grok-1.5 Vision (или Grok-1.5V). Инструмент способен обрабатывать данные, отображаемые в рисунках внутри документов, диаграммах, таблицах, скриншотах и фотографиях. Вскоре решение станет доступно для тестирования среди профессионалов рынка и текущих пользователей Grok.
xAI Илона Маска представила мультимодальную модель Grok-1.5V Екатерина Алипова Присоединиться
Презентация состоялась через несколько недель после того, как xAI представила обновленную модель чат-бота Grok-1.5. И это еще один шаг компании Маска, которая в качестве ключевой цели заявила создание «полезного общедоступного ИИ», напоминает VentureBeat.
В качестве примеры работы Grok-1.5V компания приводит несколько действий от преобразования наброска блок-схемы в код Python или преобразования таблицы в файл фрмата CSVдо создания сказки на ночь по мотивам детского рисунка или объяснения мема.
Представители xAI уверяют, что эта мультимодальная модель выделяется на фоне аналогов (GPT-4V, Claude 3Sonnet, Claude 3 Opus и Gemini Pro 1.5) и превосходит конкурентов в анализе окружающего пространства.
Преимущество достигается за счет технологии RealWorldQA (лицензия Creative Commons), обученной на 700+ изображений, которые сопровождались вопросами и ответами по каждому предмету.
Настроить свою подписку на RB.RU
Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!
Comments are closed.