Respeecher збирає голоси 1000 киримли для розпізнавання кримськотатарської мови
Український стартап Respeecher оголосив про створення нейромережі для розпізнавання кримськотатарської мови. Для цього розробники оголосили збір 1000 голосів її носіїв.
Про це повідомляє Представництво Президента України в АР Крим.
Для високоякісного аналізу Respeecher потребують 1000 годин із записами. Стартап закликає носіїв мови надіслати зразки голосу, або записати аудіо в студії тих, хто проживає в Києві.
Як допомогти Respeecher зібрати набір даних
Підписуйтеся на наші соцмережі
За словами розробників, дуже важливо, щоб аудіо мало мінімум звуків на фоні, на кшталт, шум кондиціонера, холодильника чи голоси інших людей. Бажано, щоб запис тривав від 30 хвилин до години.
Найкращими для аналізу підійдуть аудіо кримськотатарської літературної мови, які створені у тихій кімнаті з мінімально кількістю фонових шумів. Також рекомендується робити записи на хороший мікрофон, однак розробникам підійдуть навіть зразки, зроблені на смартфон.
В Respeecher наголосили, чим більше різних акцентів і тональностей голосів модель ШІ проаналізує, тим точнішим буде результат розпізнавання мови.
Носії кримськотатарської мови, які бажають долучитись до ініціативи, можуть надсилати аудіозаписи мови через цю форму.
Respeecher гарантує конфіденційність даних
Стартап запевняє, що жодні дані конкретних осіб не будуть зберігатись. Також команда не відтворюватиме чужі голоси без дозволу носія.
Усі надіслані дані будуть використані лише в цілях навчання нейромережі та для аналізу кримськотатарської мови в цілому.
Раніше стартап уже працював з найбільшими Голлівудськими студіями дотримуючись цих етичних стандартів співпраці.
Нагадаємо, в липні уряд вирішив розробити правопис латинкою для кримськотатарської мови.