OpenAI представила модель для преобразования текста в голос пользователя
OpenAI создала ИИ-синтезатор Voice Engine, который озвучивает текстовые запросы голосом пользователя. О нём компания рассказала в блоге, там же выложены примеры аудиофрагментов.
Генератору нужна запись голоса пользователя (или любого другого человека) длиной всего 15 секунд. На основе неё Voice Engine создаёт крайне реалистично звучащую копию голоса, которым можно озвучить любой текст, в том числе на языке, которым его обладатель не владеет.
Voice Engine был разработан в конце 2022 года и находится на этапе раннего тестирования среди небольшой группы партнёров OpenAI. Компания пока не решила, открывать ли доступ к нему широкой публике и каким образом — разработчики понимают, что технология может нести опасность для общества. Сейчас он применяется в голосовых функциях ChatGPT и фирменных API для преобразования текста в речь.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.