Имитация речи при помощи искуственного интеллекта
Аналог Google в Китае компания Baidu сообщила о новых достижениях в сфере эксплуатации искусственного интеллекта (ИИ). Об этом стало известно из содержания технического документа. Он был опубликован в Сети интернета. В Baidu создали систему, функционирующую на базе искусственной нейронной сети. Эта система способна анализировать и полностью клонировать живой человеческий голос. Для этого системе не нужно большое количество исходного материала, достаточно короткого фрагмента. Система качественно имитирует живую речь человека и имеет возможность вносить некоторые изменения, например добавлять акцент.
Как развивалась технология
Представленная технология имеет несколько версий, представленных ранее. Все они имитировали речь после анализа продолжительных ее фрагментов. В 2017 году специалистам из компании Baidu удалось создать технологию, точно имитирующую человеческую речь на базе материала, продолжительность которого составляла около 30 минут. В то же время разработкам конкурентов требовались менее продолжительные фрагменты для получения аналогичных результатов. Всего 20 минут исходной речи требовалось программе Voco (разработчик: Adobe). Удивительные результаты в этом направлении показала одна из канадских компаний со своей разработкой под названием Lyrebird. Всего минута записи оригинальной речи позволит программе в точности ее сымитировать.
Но компания Baidu пошла еще дальше всех своих конкурентов. Для клонирования речи новой версии программы хватит фрагмента продолжительностью всего в несколько секунд.
Где использовать технологию
Некоторые читатели, ознакомившись с этой информацией, подумают: в этой технологии нет никакого смысла и решать серьезные практические задачи с помощью нее невозможно. Но это не так. Возможности программы может использовать человек, утративший способность говорить. Отправившиеся в длительное путешествие родители, не имеющие возможности позвонить, с помощью программы смогут успокоить своего ребенка. Технология может быть успешно использована в создании цифровых ассистентов, наделенных возможностью говорить по-человечески, а не холодным голосом робота.
Возможные недостатки
При всем многообразии преимуществ этой программы у нее также существуют недостатки. Они связаны не с качеством технологии, а со сферами, где будет использоваться искусственный интеллект. Вполне возможны случаи применения разработки вне рамок законодательства. Актуальная версия программы в 95 процентов случаях обманывает специальный сервис по распознаванию голоса. Еще проще оказалось ввести в заблуждение людей. Созданные клоны получили очень высокие оценки. Общий результат: 3,16 баллов из 4. Возможности искусственного интеллекта совсем скоро могут начать использовать злоумышленники. Теперь технологии нейронных сетей (ИНС) позволяют изменять или клонировать человеческие лица в видеороликах. В сочетании с детальной имитацией голоса они будут пслужить инструментом для массового создания ложных новостей и информационных вбросов.
Даже с помощью обычного фотошопа многих людей можно легко ввести в заблуждение. Теперь попавший в руки злоумышленников ИНС, обладающий более широким функционалом, может доставить обществу гораздо больше проблем.
Добавить
КОММЕНТАРИИ
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.