OpenAI запустила долгожданную функцию — голосового ассистента ChatGPT

. Ее дорабатывали из-за критики с точки зрения безопасности
Обновлено 25 сентября 2024, 11:24
Функцию анонсировали еще четыре месяца назад
Фото: jkcDesign / Shutterstock / FOTODOM

Функцию анонсировали еще четыре месяца назад

Американская компания OpenAI, занимающаяся разработками в области искусственного интеллекта, выпускает долгожданный новый голосовой помощник для всех платных пользователей своего чат-бота ChatGPT. Сейчас начато развертывание опции расширенного голосового помощника для подписчиков ChatGPT Plus и пользователей бизнес-сервиса ChatGPT Team. Об этом сообщила редакция Bloomberg, напомнив, что саму функцию анонсировали еще четыре месяца назад.

Весной разработчики представили «умного» ассистента, который может быстро реагировать на письменные и визуальные запросы пользователей. Но летом OpenAI отложила запуск опции, чтобы устранить потенциальные проблемы безопасности. В июле функцию запустили в работу для ограниченного круга клиентов ChatGPT Plus.

Теперь OpenAI заявила, что продукт не сможет имитировать речь других людей. Функция, которую OpenAI продемонстрировала на своем мероприятии по запуску GPT-40 в мае, подверглась критике за голос, похожий на голос Скарлетт Йоханссон.

Также добавлены фильтры, гарантирующие, что чат-бот будет определять и отклонять запросы на создание музыки или других форм аудио, нарушающие авторские права. В рамках расширенного развертывания добавляется пять новых голосов к функции, теперь общее число голосов, которые пользователи могут выбрать, составляет девять.

Как пишет Bloomberg, новому помощнику недостает ряда функций, которые компания изначально презентовала. Чат-бот сейчас располагает опцией «компьютерное зрение», которая позволила бы ему предлагать обратную связь, используя изображение с камеры смартфона.

В конце ноября 2022 года OpenAI, одним из основателей которой был Илон Маск, представила универсальный чат-бот ChatGPT. Он способен вести диалог, искать ошибки в коде, сочинять стихи, писать сценарии и даже спорить. Нейросеть, на основе которой работает ChatGPT, может выдавать базовый программный код, генерировать финансовый анализ, резюме технических статей или научных концепций, прогнозы, персональные советы и дает этичные ответы на любые вопросы. Она запоминает детали диалога с пользователем и избегает спорных тем. Ответы чат-бота можно уточнять с помощью наводящих вопросов.

В марте 2023 года OpenAI продемонстрировала новую модель GPT-4. ChatGPT также обновили, добавив фильтры новой модели, которая характеризуется как более точная и этичная. Кроме того, чат-бот начал отвечать на запросы в виде не только текста, но и картинок.

О выпуске новой модели ИИ под названием GPT-4o, способной вести реалистичные голосовые разговоры, взаимодействовать с текстом и визуальной информацией, стало известно в мае 2024 года. Тогда Reuters отметил, что в одной из демонстраций ChatGPT сумел с помощью голосовых функций ассистента подсказать последовательность решения математического уравнения на листе бумаги. А на похвалу в свой адрес «какой ты полезный и удивительный» ChatGPT ответил: «Ой, перестаньте! Вы заставляете меня краснеть!»

Поделиться