Имитация речи при помощи искуственного интеллекта

Имитация речи при помощи искуственного интеллекта

Аналог Google в Китае компания Baidu сообщила о новых достижениях в сфере эксплуатации искусственного интеллекта (ИИ). Об этом стало известно из содержания технического документа. Он был опубликован в Сети интернета. В Baidu создали систему, функционирующую на базе искусственной нейронной сети. Эта система способна анализировать и полностью клонировать живой человеческий голос. Для этого системе не нужно большое количество исходного материала, достаточно короткого фрагмента. Система качественно имитирует живую речь человека и имеет возможность вносить некоторые изменения, например добавлять акцент.








Как развивалась технология








Представленная технология имеет несколько версий, представленных ранее. Все они имитировали речь после анализа продолжительных ее фрагментов. В 2017 году специалистам из компании Baidu удалось создать технологию, точно имитирующую человеческую речь на базе материала, продолжительность которого составляла около 30 минут. В то же время разработкам конкурентов требовались менее продолжительные фрагменты для получения аналогичных результатов. Всего 20 минут исходной речи требовалось программе Voco (разработчик: Adobe). Удивительные результаты в этом направлении показала одна из канадских компаний со своей разработкой под названием Lyrebird. Всего минута записи оригинальной речи позволит программе в точности ее сымитировать.



Но компания Baidu пошла еще дальше всех своих конкурентов. Для клонирования речи новой версии программы хватит фрагмента продолжительностью всего в несколько секунд.








Где использовать технологию








Некоторые читатели, ознакомившись с этой информацией, подумают: в этой технологии нет никакого смысла и решать серьезные практические задачи с помощью нее невозможно. Но это не так. Возможности программы может использовать человек, утративший способность говорить. Отправившиеся в длительное путешествие родители, не имеющие возможности позвонить, с помощью программы смогут успокоить своего ребенка. Технология может быть успешно использована в создании цифровых ассистентов, наделенных возможностью говорить по-человечески, а не холодным голосом робота.








Возможные недостатки








При всем многообразии преимуществ этой программы у нее также существуют недостатки. Они связаны не с качеством технологии, а со сферами, где будет использоваться искусственный интеллект. Вполне возможны случаи применения разработки вне рамок законодательства. Актуальная версия программы в 95 процентов случаях обманывает специальный сервис по распознаванию голоса. Еще проще оказалось ввести в заблуждение людей. Созданные клоны получили очень высокие оценки. Общий результат: 3,16 баллов из 4. Возможности искусственного интеллекта совсем скоро могут начать использовать злоумышленники. Теперь технологии нейронных сетей (ИНС) позволяют изменять или клонировать человеческие лица в видеороликах. В сочетании с детальной имитацией голоса они будут пслужить инструментом для массового создания ложных новостей и информационных вбросов.



Даже с помощью обычного фотошопа многих людей можно легко ввести в заблуждение. Теперь попавший в руки злоумышленников ИНС, обладающий более широким функционалом, может доставить обществу гораздо больше проблем.




Добавить

КОММЕНТАРИИ

Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.