OpenAI представила нейросеть для копирования голоса человека
. Новый инструмент от создателей ChatGPT получил название Voice EngineOpenAI представила нейросеть Voice Engine для копирования голоса человека
Компания OpenAI представила нейросеть Voice Engine, которая способна воссоздать голос любого человека на основе 15-секундного аудиопримера.
Разработка позволит озвучить текст на различных языках с помощью «клонированного» голоса. Для этого достаточно предоставить короткий 15-секундный образец голоса человека, который нужно воссоздать, и ввести в сервисе текст, который требуется озвучить.
Разработчики OpenAI считают, что технология будет полезна для восстановления голоса у людей, потерявших его. В то же время нейросеть таит в себе немало потенциальных угроз и может стать еще одним орудием мошенников. Впрочем, сами создатели инструмента уверяют, что «внедрили ряд мер безопасности, в том числе водяные знаки, для отслеживания происхождения всякого звука, генерируемого Voice Engine, а также мониторинг того, как используется модель».
В OpenAI также рассказали, что разработка Voice Engine началась в конце 2022 года и в процессе обучения модели использовались как лицензированные, так и открытые данные. На данный момент сервис не является общедоступным. Когда его откроют для широкой публики, не сообщается.
Незадолго до этого ученые из России и Германии создали приложение на базе искусственного интеллекта, которое позволяет управлять музыкой. С помощью голосовых команд, жестов или мимики пользователь может попросить программу воспроизвести мелодию абсолютно по-другому, создавая, таким образом, уникальные варианты произведения.