Упс! Не вдала спроба:(
Будь ласка, спробуйте ще раз.

Як ШІ конвертує голос у текст: огляд сервісу Buzz

Kirill Yermakov
Kirill Yermakov Автор телеграм-каналу AI-шня
9 лютого 2023 3 хвилин читання

Транскрибування аудіо у тексти — біль. Усі, хто хоч раз стикався з цим завданням, знають, що воно нудне, монотонне і займає багато часу. Тому краще довірити його штучному інтелекту, тим паче він це готовий робити безоплатно.

Матеріал підготовлений спеціально для читачів SPEKA автором Телеграм-каналу AI-шня

Buzz — це сервіс, що вміє транскрибувати чи перекладати або робити дві операції одночасно в автоматичному режимі. Працює завдяки технології Whisper від вельми шанованих та відомих OpenAI.

Як ШІ конвертує голос у текст: огляд сервісу Buzz зображення 1 Сервіс Buzz

Підписуйтеся на наші соцмережі

Доступно під Windows, Linux та Mac. Може працювати навіть без інтернету, але тоді варто попередньо завантажити натреновані моделі. Звісно, що краща буде якість, то більше часу триває операція і «важить» сама модель.

Сервіс можна також використовувати для генерації субтитрів, навіть різними мовами. Тобто берете звукову доріжку українською і «годуєте» стільки разів, скільки потрібно мов, змінюючи їх у налаштуваннях. 

Також є функція транскрибування у реальному часі. Людською мовою ви щось говорите — воно одразу розпізнає і друкує це у файл.

Я тестував сервіс на піснях і різної складності текстових аудіодоріжках. І ось що можу сказати:

  • Музика майже немає впливу, але краще за можливості завантажувати тільки доріжку з розмовою, аби не було викривлення звуків.
  • Надиктовану аудіорозмову на військову тематику з безліччю термінів, завантажену з телеграм-чату, воно розпізнало з точністю приблизно 90% для української мови.
  • Узяв відео з дитячими привітаннями (бо в малечі через вік неідеальна дикція) і воно розпізнало з точністю приблизно 63% для української мови.
  • Англійську та іспанську мову розпізнає майже взагалі без помилок (звісно, тому що значно краще натренована модель).
  • Мовою терористів-сусідів нічого не тестував, але вона є. Добре, що окрім неї там ще безліч інших.

Важливо: краща якість потребує більшої кількості ресурсів або якості з'єднання. У мене на High аварійно завершувалася робота, тому всі тести я робив на Medium.

Також я вирішив порівняти якість і спробував згенерувати субтитри через різні сервіси для того дитячого відео, яке воно погано розпізнало, і зробив аналогічно, використовуючи три сервіси — VEED, MotionBox і Stenograf. Перші два — це онлайн-редактори відео, останній — спеціалізований сервіс для створення субтитрів. Жоден із них не видав результат, вищий за 40% точності. 

На жаль, я не здогадався все це зібрати в одне відео, і це моя помилка, що робить мої аргументи менш залізними. Головне ж для мене було не тільки показати зручний інструмент, який може спростити життя журналістам, творцям подкастів і відео та всім, хто має завдання перетворювати записи голосу на тексти, а й довести, що безоплатний інструмент завдяки використанню добре натренованій моделі може працювати краще за схожі платні.

Єдине, про що я жалкую, що маю неідеальну дикцію і не надиктував цей матеріал без жодних правок, замість того щоб писати.

Якщо ви хочете поділитися з читачами SPEKA власним досвідом, розповісти свою історію чи опублікувати колонку на важливу для вас тему, долучайтеся. Відтепер ви можете зареєструватися на сайті SPEKA і самостійно опублікувати свій пост.
0
Icon 0

Підписуйтеся на наші соцмережі

Інші матеріали

Як зацікавити роботодавця за 30 секунд: Elevator Pitch

Олеся Руденко 21 березня 2025 08:41

Маленька, але потужна: як створити невелику технічну команду, яка замінить пів сотні людей

Сергій Марієха 21 березня 2025 11:54

Діти в гаджетах: марна трата часу чи інвестиція в майбутнє?

Євген Мощенський 21 березня 2025 17:00

AI — ворог чи інструмент? Паула Шер про нову реальність дизайну. Безкоштовний вебінар від Projector

PRJCTR OnlineInstitute 21 березня 2025 11:17

Як у мене вкрали телеграм з двофакторною автентифікацією: реальний досвід журналістки Speka

Вікторія Рудзінська 22 березня 2025 11:07