OpenAI сделала голосовой чат в ChatGPT бесплатным — и намекнула на скандал с Альтманом
Теперь голосовые чаты доступны пользователям в мобильном приложении сервиса. В его основе — модель преобразования текста в голос и система распознавания речи Whisper.
В примере, опубликованном разработчиками, есть намек на продолжающийся скандал, связанный с увольнением гендиректора Сэма Альтмана. В ролике сотрудница просит нейросеть подсказать, сколько 40-сантиметровых пицц нужно заказать, чтобы накормить 778 человек, «проголодавшихся после долгого вечера на работе». Ранее более 700 сотрудников компании подписали открытое письмо совету директоров с требованием вернуть Альтмана, в противном случае работники пригрозили уйти вслед за ним в Microsoft.
В основе функции лежит передовая модель преобразования текста в речь. Она позволяет генерировать человеческую речь из текстовых и голосовых образцов. Разработчики в сотрудничестве с профессиональными дикторами создали несколько уникальных голосов. Также используется система распознавания речи Whisper, которая позволяет преобразовывать устную речь в текст. Для активации функции пользователь должен нажать на кнопку с изображением наушников, выбрать предпочитаемый голос и начать разговор.
Читать на dev.by