Наука и техника 08 мар 2018, 17:23

​​Китайцы научили искусственный интеллект имитировать человеческий голос

Технология может служить тем, кто утратил возможность говорить.


Ученые из Китая анонсировали технологию Deep Voice: она работает на основе машинного обучения и с помощью коротких семплов способна обмануть систему распознавания голоса. Технологию исследователи тренировали на основе звуковой записи, длящейся более 800 часов и включающей в себя около 2,4 тыс. разных голосов. По словам разработчиков, для эффективной работы нейросети нужно около 100 пятисекундных звуковых сигналов.

Deep Voice способна имитировать тембр, интонацию голоса и делает их неотличимыми от настоящих. По мнению разработчиков, технологию можно использовать в роли цифровых помощников, в записи голоса для видеоигр, музыки и в синхронном переводе. Также она может служить тем, кто утратил возможность говорить. Ученые отметили, кроме того, что Deep Voice умеет менять голос, делая его мужским вместо женского или добавляя ему иностранный акцент.

«Это настоящий прорыв с технической точки зрения, — отметил один из авторов разработки Лео Зу. — Нам удалось решить сложнейшую генеративную проблему, а именно, мы смогли синтезировать живую речь со всеми ее особенностями», — приводит комментарий разработчика «Хайтек».

Это не первая инновация в этом направлении: ранее канадские разработчики представили голосовой сервис Lyrebird. Он сжимает все индивидуальные речевые характеристики в очень короткую запись, воспроизводя 1000 предложений за полсекунды. Также он способен копировать любые бытовые звуки — например, работающую бензопилу или пение конкретного вида птиц, может изображать сердитый, веселый или сочувствующий тон. Канадская разработка, как и Deep Voice, применяется для работы голосовых помощников, озвучивания мультимедийных продуктов и синтеза речи людей с ограниченными возможностями.

Но канадские и китайские разработчики отмечают, что у технологий есть общая проблема: ими могут воспользоваться мошенники, чтобы вводить людей в заблуждение или воспользоваться возможностями программ, которые работают на основе распознавания речи. Юристы говорят об опасении, что в скором времени аудиозаписи будут менее значимым доказательством в судах.

Материалы по теме
Бизнес

Юрий Коровкин, YGroup, SILVERSTREAM: Нас ждут «Яндекс» и 600 000 пользователей

За четыре года он запустил два успешных бизнеса и получил сотни миллионов инвестиций в коттеджные поселки и десятки миллионов инвестиций в свой венчурный проект. Каждый день он начинает в 5.30 и считает Сочи лучшим городом мира. Он эффективно управляет как объектами недвижимости делюкс-уровня, так и своей жизнью. И специально для "Югополиса" рассказал, почему его компании доверяют строить элитные виллы, когда продаст приложение гиганту рынка и по каким критериям берет в свою команду

Первая полоса

Последние новости

Бизнес

CL Doctor: перемен требуют ваши сердца!

В Краснодар приходит медицина будущего: технологии диагностики и лечения, которые еще вчера казались фантастикой, становятся реальностью. В сердце города открылся флагманский центр хирургии и кардиологии CL Doctor.

Бизнес

Юрий Коровкин, YGroup, SILVERSTREAM: Нас ждут «Яндекс» и 600 000 пользователей

За четыре года он запустил два успешных бизнеса и получил сотни миллионов инвестиций в коттеджные поселки и десятки миллионов инвестиций в свой венчурный проект. Каждый день он начинает в 5.30 и считает Сочи лучшим городом мира. Он эффективно управляет как объектами недвижимости делюкс-уровня, так и своей жизнью. И специально для "Югополиса" рассказал, почему его компании доверяют строить элитные виллы, когда продаст приложение гиганту рынка и по каким критериям берет в свою команду