OpenAI представил новую модель ИИ GPT-4о с улучшенным голосовым функционалом.

Компания OpenAI анонсировала новую модель искусственного интеллекта — GPT-4o.

В её названии буква «o»— это сокращение слова «omni», что означает «всесторонний».

По сравнению с предыдущими версиями, новая модель значительно лучше распознаёт изображения и обрабатывает аудиоинформацию. Она может понимать нюансы человеческой речи и отвечать на вопросы пользователей в различных эмоциональных стилях.

Модель GPT-4o также может обрабатывать видео и работать с 50 различными языками.

Эта модель работает с текстом, голосом и изображениями. Она реагирует на речь и голос людей в режиме реального времени.

Пользователи могут общаться с GPT-4o как с виртуальным помощником, который понимает контекст разговора и адаптирует свой ответ к различным нюансам.

Версия GPT-4Turbo, ранее считавшаяся самой продвинутой, имеет схожую производительность с моделью GPT-4o, но последняя особенно эффективна в обработке аудио- и видеоинформации.

Доступ к возможностям GPT-4o будет доступен пользователям с 13 мая. Однако голосовые функции будут доступны только для небольшой группы доверенных партнёров в ближайшие недели, а с июня — для платных подписчиков.

Источник: TechCrunch.
Видео: Канал OpenAI на YouTube.

12