Компания OpenAI анонсировала новую модель искусственного интеллекта — GPT-4o.
В её названии буква «o»— это сокращение слова «omni», что означает «всесторонний».
По сравнению с предыдущими версиями, новая модель значительно лучше распознаёт изображения и обрабатывает аудиоинформацию. Она может понимать нюансы человеческой речи и отвечать на вопросы пользователей в различных эмоциональных стилях.
Модель GPT-4o также может обрабатывать видео и работать с 50 различными языками.
Эта модель работает с текстом, голосом и изображениями. Она реагирует на речь и голос людей в режиме реального времени.
Пользователи могут общаться с GPT-4o как с виртуальным помощником, который понимает контекст разговора и адаптирует свой ответ к различным нюансам.
Версия GPT-4Turbo, ранее считавшаяся самой продвинутой, имеет схожую производительность с моделью GPT-4o, но последняя особенно эффективна в обработке аудио- и видеоинформации.
Доступ к возможностям GPT-4o будет доступен пользователям с 13 мая. Однако голосовые функции будут доступны только для небольшой группы доверенных партнёров в ближайшие недели, а с июня — для платных подписчиков.
Источник: TechCrunch.Видео: Канал OpenAI на YouTube.