Яндекс.Метрика
  • Анастасия Лучкова

Нейросеть научилась клонировать голоса

Чтобы это сделать, ИИ достаточно 15-секунд послушать человека
Фото: Роман Пименов / «Петербургский дневник»

Компания OpenAI анонсировала модели для трансформации текста в голос Voice Engine. Чтобы клонировать голос человека, нейросети достаточно 15-секундного примера, что ее и отличает от остальных похожих сервисов.

Как говорится в блоге компании, нейросеть слушает пример голосового сообщения человека, затем ей дают текст, который она читает, копируя этот голос.

Специалисты OpenAI заявили, что такая технология поможет восстановить голос людям, страдающим от его потери. Новая разработка хранит в себе и потенциальные угрозы. Банкам и другим организациям уже рекомендовали уходить от биометрической аутентификации с помощью голоса. Им также рекомендовано информировать людей об угрозах нейросети и учить, как отличать сгенерированный контент от настоящего.

Разработку Voice Engine специалисты начали в конце 2022 года. Когда этот сервис станет общедоступным, пока неизвестно. 

Ранее «Петербургский дневник» сообщал, что нижегородские ученые создали нейросеть для фотонных технологий. Подробнее читайте здесь.