Интересное:
Робот Atlas компании Boston Dynamics учится взаимодействовать с окружающей средой и использовать подручные предметы
Информация

Робот Atlas компании Boston Dynamics учится взаимодействовать с окружающей средой и использовать подручные предметы Информация

Меган Фокс вернулась в Instagram после двухлетнего перерыва – отреагировал даже бывший

Меган Фокс вернулась в Instagram после двухлетнего перерыва – отреагировал даже бывший

Nexon признала провал The First Descendant и отсутствие долгосрочной перспективы

Nexon признала провал The First Descendant и отсутствие долгосрочной перспективы

The House of the Dead: Remake
Ремейк The House of the Dead выйдет на PS5 в конце недели

The House of the Dead: Remake Ремейк The House of the Dead выйдет на PS5 в конце недели

В семье Опры Уинфри случилось несчастье: телеведущая в трауре

В семье Опры Уинфри случилось несчастье: телеведущая в трауре

Лесю Никитюк называли стручком, а Позитива дразнили за девичий голос: какие известные звезды страдали от сверстников в школе

Лесю Никитюк называли стручком, а Позитива дразнили за девичий голос: какие известные звезды страдали от сверстников в школе

Путешествия во времени, апокалипсис и копы в геймплее необычной гоночной аркады Stuntman Hollywood

Путешествия во времени, апокалипсис и копы в геймплее необычной гоночной аркады Stuntman Hollywood

Кравец из “Квартал-95” сделала шокирующее признание: теперь ее жизнь никогда не будет прежней

Кравец из “Квартал-95” сделала шокирующее признание: теперь ее жизнь никогда не будет прежней

Like a virgin: знаменитости, которые хранили девственность до свадьбы

Like a virgin: знаменитости, которые хранили девственность до свадьбы

У принцессы Анны лучшая реакция на осознание того, что толпа поддерживала ее во время Джамботрона

У принцессы Анны лучшая реакция на осознание того, что толпа поддерживала ее во время Джамботрона

Home » Технологии » Microsoft VALL-E – новая ИИ-модель, способная адаптироваться к голосу по образцу, длительностью в 3 секунды Информация

Microsoft VALL-E - новая ИИ-модель, способная адаптироваться к голосу по образцу, длительностью в 3 секунды Информация

Искусственный интеллект

Исследователи компании Microsoft представили одну из своих последних разработок, модель искусственного интеллекта (ИИ) под названием VALL-E, которая предназначена для преобразования текста в живую речь. Отметим, что это не первая модель такого рода, но если алгоритму Lyrebird 2017, к примеру, разработанному в университете Монреаля, требовалась целая минута записи для анализа, то модели VALL-E достаточно всего трех секунд, после чего она начинает подражать речи конкретного человека, включая акустическую окраску и эмоциональный тон.
Модель VALL-E была натренирована на 60 тысячах часах записи речи на английском языке, главным образом на аудиокнигах, начитанных разными людьми. Это дало свой результат, модель воспроизводит предложения, звучащие совершенно естественно. Единственным недостатком модели является то, что модель дает сбои в звучании, когда в предложениях встречаются странные места с точки зрения синтаксиса или пунктуации.
Модели VALL-E также дается очень хорошо воссоздание условий аудиосреды исходного образца. Если этот образец, к примеру, был записан с телефона, то и вся дальнейшая синтезированная речь будет “как из телефона”. Также модель способна воспроизводить тонкости речи, похожие образцы, записанные американцем или британцем, дадут совершенно различные результаты.
Также модель VALL-E способна придавать речи эмоциональный окрас. Только для этого ей необходимо предоставить несколько образцов речи, помеченных, как сердитый, сонный, удивленный, чувствующий отвращение и т.п. Чем больше таких образцов будет предоставлено, тем более эмоциональной и естественной становится синтезированная речь.
Последствия появления таких технологий весьма ясны. С положительной стороны, вы можете получить озвученный голосом известного актера список покупок, находясь в супермаркете, или ваш телефон будет начитывать аудиокнигу подходящим для ее содержимого голосом, или даже несколькими голосами.
Но с отрицательной стороны все выглядит намного ужасней. Представьте себе мошенника, получившего образец вашего голоса, который потом звонит вашим ближним родственникам. Также при помощи данной технологии возможен обход систем голосовой идентификации, а фальсифицированная запись выступления какого-либо известного политика может вызвать сокрушительный крах его карьеры.
И в заключении следует отметить, что все мы в последнее время видим, что системы искусственного интеллекта типа DALL-E, ChatGPT и другие deepfake-технологии начинают перемещаться из лабораторий в реальный мир. И эти изменения, как обычно, приносят одновременно массу новых возможностей и новых рисков. Но, надо надеяться, что упомянутые выше риски не столь значимы, как говорится, клин клином вышибают, и распознать фальсифицированную речь сможет подобная и специально натренированная модель искусственного интеллекта.

June 2026
MTWTFSS
1234567
891011121314
15161718192021
22232425262728
2930 

О сайте

Новости о жизни звезд и знаменитостей – самая актуальная информация. Самые последние новости звезд шоу-бизнеса. Новости телешоу, сериалов.

© Copyright © 2022-2024. – All Rights Reserved.