В центре внимания

Google создал генератор речи, неотличимый от голоса человека

Google создал генератор речи, неотличимый от голоса человека

В статье, опубликованной Google, описывается компьютерная программа, способная в точности имитировать человеческий голос. Она называется Tacotron 2 и служит для преобразования текста в речь. О разработке рассказывает Quartz.

Программа состоит из двух нейросетей глубокого обучения. Первая преобразует текст в спектрограмму и передает алгоритму WaveNet, который озвучивает ее, генерируя соответствующие звуковые элементы. Tacotron 2 справляется с трудными для произношения словами и названиями, а также меняет речь в зависимости от пунктуации. Например, она может с помощью интонации подчеркнуть слово, написанное с заглавной буквы.

Образцы работы Tacorton 2 можно прослушать на официальном сайте Google. Эта технология, скорее всего, сразу начнет использоваться в продуктах компании. WaveNet, впервые анонсированная в 2016 году, теперь служит для генерации голоса в Google Assistant. Tacotron 2 может стать еще более мощным дополнением к сервису.

К сожалению, пока программа может говорить только единственным женским голосом. В отличие от Tacotron 2, продукт канадского ИИ-стартапа Lyrebird, по словам разработчиков, способен точно имитировать голос любого человека. Для этого достаточно звукового файла продолжительностью 1 минута.

Источник

Читайте также
Поделиться ссылкой ВКонтакте Поделиться ссылкой в Facebook Поделиться ссылкой в Twitter Поделиться новостью в ЖЖ Поделиться ссылкой в Моем Мире Поделиться ссылкой в Одноклассниках

28.12.2017 5:46 | Светлана Любкина

Поиск:

Поиск по сайту
Экономические новости
Супер Идея ВКонтакте
Супер Идея в Facebook
Супер Идея в Твиттере
Супер Идея в Google+
Все права защищены © 2012-2024 Супер Идея
| XML | RSS
Любое копирование материалов с сайта sup-idea.com без указания обратной активной гиперссылки на источник запрещено.