Искусственный интеллект научат читать книги голосами авторов

Китайская поисковая система Sogou создает двойников искусственного интеллекта, чтобы читать популярные романы голосами авторов.

Компания анонсировала "реалистичные" аватары китайских авторов Юэ Гуана и Бу Синь Тянь Шаня Дяо Сиань Бина, созданные на основе видеозаписей, на конференции China Online Literature +, сообщает comments.ua.

В прошлом году Sogou запустил две программы чтения новостей AI, которые все еще используются правительственным агентством новостей Синьхуа. Теперь это простой процесс использования технологии преобразования текста в речь для быстрого создания аудиоверсии книги с использованием оцифрованных синтетических голосов.

Но большинство людей предпочитают аудиокниги, которые "профессионально рассказывают" авторы, актеры или известные общественные деятели. И теперь, достижения в области машинного обучения и технологий преобразования речи в текст означают, что оцифрованные голоса становятся более реалистичными.

Например, компания Lyrebird позволяет клиентам создавать собственные "вокальные аватары" всего за одну минуту записи их голосов. На своем веб-сайте она демонстрирует свои услуги с помощью двух аудиозаписей бывшего президента США Барака Обамы и нынешнего президента США Дональда Трампа, созданных с использованием машинного обучения.

Между тем, лондонский технологический стартап DeepZen заявляет, что его синтетическая речевая технология может создать несколько версий аудиокниги в течение нескольких часов, сократив время и затраты примерно на 90%.