Alphabet Inc представила новую версию нейросети Gemini Pro 1.5
Новая версия нейросети является мультимодальной моделью, то есть она способна воспринимать не только текст, но и аудио, видео, изображения и, как подчеркивают разработчики, может обрабатывать в несколько раз больше аудио, видео и текста, чем модель GPT-4 от OpenAI
Читать на полной версииAlphabet Inc, материнская компания Google, представила новую версию своей флагманской модели искусственного интеллекта. Нейросеть Gemini Pro 1.5 способна обрабатывать в несколько раз больше аудио, видео и текста, чем модель GPT-4, на которой основан популярный чат-бот от OpenAI.
В частности, по заявлениям разработчиков, в контекстное окно нейросети можно вместить всю трилогию «Властелин колец». Технологическая борьба искусственных интеллектов давно ведется между Google и OpenAI.
Особенности новой модели Gemini Pro 1.5 комментирует главный архитектор систем искусственного интеллекта исследовательского центра ИИ по направлению «Транспорт и логистика» НИЯУ МИФИ Роман Душкин:
Технологическая борьба искусственных интеллектов, которая давно ведется между Google и OpenAI, продолжается.
В пятницу OpenAI объявила о создании новой нейросети для генерации видео — Sora. Модель способна создавать минутные видеоролики по текстовому описанию. Причем результат отличается высоким качеством: видео получаются очень реалистичными, в том числе с изображением людей, животных и быстро движущихся объектов.