Упс! Не вдала спроба:(
Будь ласка, спробуйте ще раз.

Data science: що це за галузь та з чим працює

28 липня 2023 4 хвилин читання

Ми майже 10 років чуємо, що дані — то нова нафта. Дані аналізують в усіх галузях — від медицини до сільського господарства. Але ще не усі знають, що насправді приховано за словосполученням data science. SPEKA розібралась, чим займається наука про дані й до чого тут штучний інтелект.

Data science: що це за галузь та з чим працює зображення 1 Data science: що це

Що таке data science

Data science — це вивчення даних для отримання інформації, що допоможе ухвалювати бізнес-рішення, будувати стратегії чи робити висновки щодо розвитку подій. 

Це міждисциплінарна галузь, що поєднує принципи та практики статистики й computer science. Термін data science зʼявився ще у 1960-тих, але тоді його значення було дещо іншим, це був синонім статистики. Сучасне значення запропонували наприкінці 1990-х. 

Data science містить:

Підписуйтеся на наші соцмережі

  • збір даних;
  • покращення якості даних;
  • пошук корисних ознак у даних;
  • пошук адекватної моделі та підбір її параметрів;
  • розгортання моделі для роботи з реальними даними.

Ключові професії, що повʼязані з data science

Дата-аналітики відповідають за пошук корисної для бізнесу інформації у датасетах (наборах даних), інтерпретацію цих даних, а також створення звітів та візуалізацій, що доноситимуть інформацію до керівництва компанії або до клієнтів. Аналітики даних вміють працювати з Tableau або Microsoft Power BI, а також писати SQL-запити

Дата-інженери відповідають за створення та керування дата-пайплайнами. Вони створюють і тестують екосистеми даних для бізнесу, щоб більшість дата-саєнтистів та ML-інженерів могли запускати свої алгоритми на оптимізованих платформах даних. 

Дата-саєнтисти займаються збиранням, упорядкуванням та аналізом даних. Вони знаходять закономірності у великих обсягах даних, а також пишуть алгоритми та впроваджують моделі машинного навчання, зокрема, для прогнозування, класифікації або кластеризації. Дата-саєнтисти добре знаються на математиці, а також використовують у роботі мови програмування, зокрема R, Python і SQL.

ML-інженери — це програмісти, що перетворюють написану дата-саєнтистами модель на код й інтегрують його у наявну систему компанії. Уміння писати якісний код для ML-інженерів важливіше, ніж для дата-саєнтистів.

І machine learning інженери, і дата-саєнтисти працюють в галузі машинного навчання, тобто використовують дані для побудови експертних моделей. Ці моделі роблять висновки, спираючись на дані. 

Усі ці ролі у компаніях зазвичай перетинаються. У невеликих командах спеціалісти універсальні й часто можуть виконувати усі функції, що повʼязані з data science.

Data science, machine learning та deep learning

Data science використовує машинне навчання та його підгалузь — глибинне навчання. 

Машинне навчання (machine learning) — це набір методів, інструментів і алгоритмів, що навчає компʼютери аналізувати дані й знаходити у них певні патерни, щоб робити прогнози. Глибинне навчання (deep learning) займається побудовою штучних нейромереж, які здатні обробляти великі обсяги інформації. Саме роботу цих нейромереж ми звикли називати штучним інтелектом. NLP (обробка природної мови) й computer vision (компʼютерний зір) — це приклади систем, що працюють на основі deep learning. 

Також важливі галузі класичного (не глибокого) машинного навчання — робота з часовими рядами та з табличними (табулярними) даними.

0
Icon 0

Підписуйтеся на наші соцмережі

Інші матеріали

Як музика змінює наші спогади?

Сніжана Лепко 14 березня 2025 09:19

Метод GTD: 5 простих кроків до організації завдань та підвищення ефективності

Сніжана Лепко 13 березня 2025 08:58

Юридичний комплаєнс при релізі MVP: ключові ризики та рішення

Оксана Петрусь 13 березня 2025 18:54

Серія потужних вибухів пролунала на росії: куди поцілили

Владислав Паливода 13 березня 2025 08:07

Опитування: чи готова ваша компанія до комунікацій під час кібер- та інфокриз?

Європейська Бізнес Асоціація 13 березня 2025 12:28