Новый ИИ OpenAI способен клонировать голос человека из 15-секундного аудио

Опубликовано Апр 2, 2024

Компания OpenAI сообщила о готовности к внедрению нового ИИ-инструмента Voice Engine. С его помощью можно клонировать голоса людей на основе аудиозаписи их речи длительностью всего 15 секунд. При этом сгенерированные голоса звучат не только естественно, но и эмоционально и реалистично. Работа над технологией велась с 2022 года.

В компании заявили, что считают технологию полезной. Она может быть отличным решением для помощи при чтении и переводах. Кроме того, Voice Engine выглядит панацеей для всех, кто страдает дегенеративными расстройствами речи. В качестве примера разработчики рассказывают о том, как инструмент уже помог одному из таких пациентов успешно реализовать школьный проект. Но технология также вызывает и значительные опасения. OpenAI указывает на высокие риски, с которыми сопряжено ее широкое внедрение.

Сейчас смотрят

У берегов Норвегии появится первый вертикальный…

«Ростех» расстреляет птицами остекление самолетов

Мошенники, скорее всего, будут активно использовать возможности Voice Engine или ее аналогов в своих интересах. Чтобы снизить риски, компания установила несколько правил, которые должны неукоснительно соблюдать все, кто намерен использовать сервис. Прежде всего, требуется уведомлять аудиторию, что голос создан нейросетью. Также предусмотрены водяные знаки и система упреждающего мониторинга. Также будет действовать запрет на клонирование голосов известных личностей. И, конечно, никто не имеет права использовать чей-то голос без его согласия.

Точной даты, когда начнется развертывание Voice Engine, пока нет — однако известна стоимость подписки. Она составит 15 долларов за 1 000 000 озвученных символов — это сопоставимо с полноценной книгой. Также ожидается подписка на HD-версию сервиса за 30 долларов, но каковы ее преимущества пока не сообщается.

Источник