Microsoft создала нейросеть для подделки человеческого голоса

Компания Microsoft создала нейросеть VALL-E для преобразования текста в речь, которая может имитировать голос любого человека на основе образца продолжительностью всего три секунды.
Полученный образец VALL-E разбивает на мельчайшие фрагменты и сравнивает их с уже имеющейся базой данных. Зная, как в разных ситуациях звучат голоса других людей, нейросеть "предполагает", как в тех же условиях будет звучать "донор". Таким образом, у VALL-E получается очень правдоподобно имитировать голос носителя образца с естественными интонациями.
При создании VALL-E использовалась технология сжатия аудиосигнала EnCodec и библиотека записей голосов более 7 000 человек с общим хронометражем около 60 000 часов Libri-light. Оба продукта принадлежат корпорации Meta.
В Microsoft считают, что новая нейросеть будет полезна при создании аудиоконтента на основе текста. В частности, VALL-E может быть использована совместно с генератором текстов GPT-3 для создания полностью оригинального контента.
Источник: gazeta.ru
Минобороны Азербайджана опубликовало еженедельный обзор - ВИДЕО
Какое наказание грозит водителям за громкую музыку в автомобиле? - ВИДЕО
В связи с непогодой на дорогах Азербайджана снизится видимость
В Гёранбое автомобиль насмерть сбил пешехода
Первая за весну продолжительная магнитная буря обрушилась на Землю
Странный способ мошенничества в Баку: у мужчины забрали автомобиль, а затем снова продали его ему - ВИДЕО
"Смертельная гонка" на аэропортовском шоссе: почему пешеходы не пользуются переходами? - ВИДЕО
Что грозит тем, кто снимает жилье без договора аренды? - ВИДЕО
Задержан мужчина, пытавшийся угнать автомобиль под действием наркотиков
В Бардинском районе ВАЗ врезался в КАМАЗ: есть погибший
Хэмилтон объяснил, почему не удержал первое место в спринте Гран-при Китая










