В России создали ИИ-сервис, воспроизводящий голоса знаменитостей на русском языке
В конце октября 2019 года было объявлено о запуске сервиса Vera Voice, который позволяет синтезировать голоса знаменитостей на русском языке. Это совместный продукт компании Screenlife Technologies Тимура Бекмамбетова и разработчика HR-сервиса «Робот Вера» Stafory.
В основе Vera Voice лежит нейросеть, способная учиться копировать речь людей с оригинальных записей. Разработка будет использоваться в интерактивных мобильных приложениях по мотивам фильмов и сериалов, в которых пользователи смогут «разговаривать» с персонажами.
Также сервис можно будет использовать для озвучки аудиокниг, рекламы, компьютерных игр и другой тематической продукции.
По словам соучредителя Stafory Владимира Свешникова, для синтеза голоса достаточно нескольких часов аудиоданных, озвученных обладателем голоса, и оцифрованного текста, который он зачитывает. Аудиопоток и текст выгружаются в несколько нейронных сетей одновременно, одна генерирует спектрограмму звука (его визуальное изображение), а вторая — непосредственно звук, рассказал он.
Screenlife Technologies и Stafory планируют заключать договоры с обладателями голоса — Vera Voice станет агентом по синтезу его речи. Первый пилот должны запустить в ноябре 2019 года.
Уже был подписан договор на легальное использование голоса сооснователя студии «Кубик в кубе» Руслана Габидуллина для записи аудиокниг, интерактивной рекламы, игр и голосовых открыток.
Также Vera Voice ведёт переговоры об использовании её технологий с агентством аудио-коммуникаций Unisound, первые проекты могут появиться в начале 2020 года.
Авторы проекта намерены защищать интересы обладателей голосов и бороться с фейками. По словам Тимура Бекмамбетова, «отлавливать подделки и защищать известных людей от несанкционированного копирования их образов — одна из главных задач».