Упс! Не вдала спроба:(
Будь ласка, спробуйте ще раз.

ШІ від Microsoft може імітувати будь-чий голос із 3-секундного зразка

Катерина Колонович
Катерина Колонович Новинарка Speka.Media
10 січня 2023 2 хвилин читання

VALL-E AI від Microsoft може імітувати будь-який голос із короткого звукового зразка. Він навіть може зберегти «емоції та акустичне середовище» мовця.

Корпорація Microsoft продемонструвала останнє дослідження штучного інтелекту з перетворенням тексту в мову за допомогою моделі під назвою VALL-E, яка може імітувати чийсь голос лише за трисекундним аудіо зразком. Мова може відповідати не тільки тембру, але й емоційному тону оратора, і навіть акустиці кімнати. Одного разу його можна буде використовувати для високоякісних програм синтезу мовлення, хоча, як і deepfakes, він несе ризики незаконного використання, повідомляє Ars Technica.

У статті дослідники описують, як вони тренували VALL-E на 60 000 годинах мовлення англійською мовою від 7 000 носіїв аудіотеки Meta LibriLight. Голос, який він намагається імітувати, має бути близьким до голосу з навчальних зразків. Якщо це так, VALL-E використовує навчальні дані, щоб зробити висновок, як би звучав цільовий оратор, коли б вимовляв потрібний текст.

Підписуйтеся на наші соцмережі

Результати поки що неоднозначні: одні голоси звучать машинно, а інші напрочуд реалістично. Щоб удосконалити модель, Microsoft планує розширити навчальні дані. Компанія також вивчає способи скорочення незрозумілих або пропущених слів.

Корпорація Microsoft вирішила не робити код відкритим. «Оскільки VALL-E може синтезувати мовлення, яке зберігає ідентичність мовця, це може нести потенційний ризик у неправильному використанні моделі, наприклад, підробка голосової ідентифікації або видавання себе за іншу особу», — заявила компанія.

Раніше стало відомо, що Microsoft розглядає шляхи інтеграції штучного інтелекту від OpenAI в свої додатки Word, Outlook та PowerPoint. При цьому у Word вже додали невідому версію GPT-моделі OpenAI. Вона поліпшує функцію автозаповнювання у документах.

Підписуйтеся на наші соцмережі

50 UAH 150 UAH 500 UAH 1000 UAH 3000 UAH 5000 UAH
0
Прокоментувати
Інші матеріали

Чи можна довірити ШІ вибір подарунків на новорічні свята

Анастасія Ковальова 8 годин тому

ChatGPT вирвався з-під контролю під час тестів

Анастасія Ковальова 8 годин тому

Google Photos представив нову функцію з підсумками року

Вікторія Рудзінська 15 годин тому

OpenAI запускає «12 днів OpenAI» з низкою анонсів

Вікторія Рудзінська 6 грудня 2024 20:34

600 млн кібератак щодня: як зросли загрози у кіберсекторі за рік

Павло Бартос 6 грудня 2024 13:55