Упс! Не вдала спроба:(
Будь ласка, спробуйте ще раз.

Чи може штучний інтелект замінити людей в музиці?

Владислав Стороженко
Владислав Стороженко координатор проєкту ГО «Інститут постінформаційного суспільства»
12 квітня 2023 10 хвилин читання

У сучасному світі штучний інтелект швидко входить у всі сфери життя людини, це не оминуло і творчість. Варто одразу наголосити, що люди намагалися залучити комп'ютерні технології до створення музики ще у 1961 році, коли навчили IBM 7094 співати пісню Daisy Bell. Це була перша спроба синтезувати голос. Тепер інструментарій для створення музики набагато ширший.

Як ШІ створює музику

Google наприкінці січня цього року анонсував MusicLM — штучний інтелект, який працює за формулою, схожою на всім відомий Midjourney, можна просто написати описовий текст, і він на його основі генерує музику в будь-якому жанрі. Поки доступу до цього ШІ у звичайного користувача немає, але команда розробників опублікувала багато прикладів, з якими можна ознайомитись і зробити свої висновки.

Загалом можна сказати, що музика, створена штучним інтелектом, далека від ідеалу. Вона містить достатньо нерівностей та глітчів, а генерований вокал і хор можуть «з натяжкою» відповідати тільки мінімальним стандартам.

Існує також перспективний ШІ-інструмент під назвою Jukebox від OpenAI. Це нейронна мережа, що може створювати пісні у різних стилях та імітує голос певного співака. Вона вчиться знаходити і розуміти зв'язок між різними нотами у наданих їй даних і не просто копіює мелодії, а створює нові, але схожі на свої оригінали.

Цікаво, що закон про авторське право зараз ніяк не обмежує подібну діяльність і ви абсолютно легально можете послухати пісні, згенеровані Jukebox, у виконанні Френка Сінатри, Елвіса Преслі, The Beatles тощо на платформі SoundCloud. Звісно, відчувається штучність голосу, але це вже можна слухати і називати більш-менш серйозною музикою.

Штучний інтелект як автор пісень

ШІ можуть використовувати для написання текстів пісень. Для цього може бути використаний навіть ChatGPT. Під час власних спроб оцінити його можливості, можу заявити, що римування англійською у нього виходить непогано, хоча розмір та ритміку він не завжди зберігає.

Щодо української мови ситуація гірша: рими підбирає він з перемінним успіхом, у більшості випадків розмір відсутній і не завжди можна інтуїтивно підібрати мелодію вокалу. Більш «розумна» версія — GPT-4, справляється із завданнями краще, але недостатньо, щоб робити гучні висновки.

Єдине, що дійсно дивує, це його уміння розкривати ідеї. Достатньо написати декілька рядків одного куплету та, бажано, приспів і він гарно продовжує сюжетну лінію пісні, нехай, і у форматі білого віршу. Для людини, яка вміє працювати з текстами і римою це може бути цінним генератором ідей, коли застопорився та не можеш придумати як продовжити.

Спеціалізовані напрямки використання ШІ у створенні музики

Ще хочу зупинитися на більш вузькоспеціалізованих напрямках, але не менш цікавих ШІ. Досить давно існує програма VOCALOID від компанії Yamaha. Декілька місяців тому, вона отримала оновлення, яке імплементує штучний інтелект VOCALOID: ШІ для створення виразних та натуральних голосів.

Програма відрізняється можливостями детального налаштування вокалу: можна регулювати акценти, вібрато, додавати характерні мілізми. Ознайомившись з її роботою, можна впевнено говорити, що можливості цього ПЗ знаходяться на досить високому рівні.

Це можна почути на опублікованому прикладі, хоча для досягнення такого результату, потрібно витратити немало часу на таку кропітку роботу. Звідси постає питання: «Не простіше записати голос, затюнити і накинути на нього ефектів?». Але, заради справедливості зазначу, що в Азії є певний спектр музичних жанрів, що передбачають використання саме штучного голосу.

Продовжуючи попередній пункт, в 21 столітті, певну популярність набирають концерти голограм. Не всіма людьми вони сприймаються однозначно, особливо, коли організатори гастролей намагаються повернути до життя культових співаків. Гарним прикладом може служити виступ голограми Вітні Г'юстон.

Найцікавіше те, що подібні концерти не є новинкою і, навіть, на болотах з їх технологіями рівня «аналоговнет» десять років тому гастролювала голограма лідера гурту «Кино» Віктора Цоя та, трохи пізніше, В. Висоцького.

Повертаючись до Азії, подібні концерти там користуються неймовірною популярністю, люди збираються щоб подивитись на виступ анімованого персонажу, який гастролює з живою групою. Виглядає це досить дивно, але дуже цікаво.

Які перспективи у ШІ в якості композитора та автора пісень 

З вищезазначеного, може скластись враження, що штучний інтелект дихає творцям в спину і вони знаходяться в групі ризику. Один ШІ напише текст, другий згенерує музику і голос, а третій створить голограму артиста і вона відправиться в тур.

Мені здається, що з такою історією людство зіткнеться не скоро. Моя впевненість базується на тому, що штучний інтелект не може породжувати думку і не має інтуїції. Створення музики це особливий, сакральний процес. Автор може вкласти в пісню власний досвід, переживання, емоційні потрясіння або, просто, випадково руки натраплять на  необхідний акорд або ноту і в голові складеться весь пазл. Хочу звернутись до історії та нагадати як створювались деякі культові пісні:

  • 1
    The Beatles – Let It Be. Автором пісні є Пол Маккартні. Пісня прийшла йому у сні, де він бачив свою покійну маму, яка йому говорила, що все буде добре. Це сталося на фоні погіршення відносин в групі і нестабільно емоційного стану. Він був впевнений що вона використовувала фразу «Let It Be». Таким чином сон став поштовхом для створення світового музичного шедевру.
  • 2
    Deep Purple – Smoke on the Water. Група приїхала на концерт в Швейцарію, де повинні були виступати після Френка Заппи, але під час його виступу в залі почалась пожежа і комплекс був знищений вогнем. А музиканти Deep Purple дивились за цим з номеру готелю навпроти, як дим покриває Женевське озеро і вирішили просто описати події.
  • 3
    Nirvana – Smells Like Teen Spirit. Це історія коли автор побачив щось своє у банальній і прямолінійній фразі. Кобейн придумав назву пісні після того, як його подруга Кетлін Ханна, на той час солістка гурту Bikini Kill, на стіні будинку Кобейна написала фразу «Kurt Smells Like Teen Spirit». Ханна мала на увазі, що від Кобейна пахло популярним молодіжним дезодорантом Teen Spirit, яким користувалася його тодішня подруга Тобі Вейл. Музикант зрозумів цю фразу як гасло з революційним підтекстом — «Від Курта віє підлітковим духом», оскільки того вечора вони обговорювали анархізм та панк-рок. Згодом Кобейн стверджував, що дізнався про існування дезодоранту лише за кілька місяців після виходу пісні.

Щодо штучного інтелекту, на даний момент він може тільки імітувати творчий процес, аналізуючи неймовірну кількість пісень вже створених людиною, та обмежений загальноприйнятими шаблонами музики. Звідси, існує ризик, що музика у виконанні ШІ буде ставати все нуднішою і схожою одна на одну.

Такі висновки можна зробити з дослідження, в якому було проаналізовано близько 1300 купетів та приспівів популярних пісень, щоб визначити які акорди і послідовності є найпопулярнішими. Отримані результати не сильно здивують музикантів, частіше за все використовуються акорди: соль мажор (G) у 73% випадків; фа мажор (F) у 73% випадків; до мажор (С) у 68% випадків; ля мінор (Am) у 56% випадків. А з приводу послідовностей, то вона виглядає так: C – G – Am – F. Прикладами використання можуть служити: Journey «Don't Stop Believing„; The Beatles «Let It Be„; Maroon 5 «She Will Be Loved„; Lady Gaga «Edge Of Glory».

Враховуючи, що в більшості популярних пісень використовується куплетно приспівна форма для побудови тексту, то ШІ, в ході аналізу може розцінити вищезазначене, як найефективнішу формулу для створення пісні. Хоча не можна виключати того фактору, що після безкінечних циклів аналізу зможе видати якусь інновацію.

З концертами історія схожа, на мою думку, кожен концерт це унікальна подія, де вже відомі для фанатів пісні виконуються особливо. Все від того, що на виконання пісні групою може впливати все, що завгодно. Починаючи від настрою виконавців, закінчуючи якістю манікюра гітариста.

Також не потрібно забувати про імпровізацію. Наприклад, Джимі Хендрікс, що робив справжнє імпровізаційне шоу для слухачів або виступи гітариста Guns N« Roses на прізвисько Slash, а що вже говорити про джаз, синонім слова »імпровізація«, ті ж концерти B.B. King в колаборації з іншими відомими артистами. Цей процес повністю заснований на емоціях виконавця і публіка це відчуває, такого більше не буде, це все тут і зараз. Звичайно, штучний інтелект не зможе подібного повторити.

Отже, AI в найближчій перспективі не зможе замінити людину в музиці, але його можливо використовувати як корисний інструмент. Можна взяти приклад з прогресивних художників, які використовують його для створення базових зображень або дизайнів на основі певних параметрів, генерують нові ідеї, або просто для швидкого створення великої кількості зображень.

Митці використовують ШІ для автоматизації певних завдань, наприклад, для розфарбовування або ретушування зображень. Це допомагає заощадити час і дозволити художникам зосередитися на більш творчих аспектах своєї роботи. Ця формула працює і по відношенню до музикантів, вони можуть за допомогою ШІ згенерувати сотні мелодій і вибрати декілька з них, що запам'ятовуються і на основі цього створити власну композицію. Тому не потрібно боятися штучного інтелекту, а використовувати його на власну користь, це може допомогти побороти страх «білого листа».

Якщо ви хочете поділитися з читачами SPEKA власним досвідом, розповісти свою історію чи опублікувати колонку на важливу для вас тему, долучайтеся. Відтепер ви можете зареєструватися на сайті SPEKA і самостійно опублікувати свій пост.
0
Прокоментувати
Інші матеріали

Google допомагає постачальникам зменшити викиди завдяки новим енергетичним проєктам

Вікторія Рудзінська 9 годин тому

Apple готується додати функції штучного інтелекту до Vision Pro

Вікторія Рудзінська 10 годин тому

Бренд, побудований на провокації та сексуалізації: історія Playboy

Артем Беседа 27 червня 2024 17:41

Чи може сервісна економіка зробити світ багатим?

Олександр Тартачний 27 червня 2024 14:40

Як я провела Ukrainian Blockchain Week 2024

Владислав Миронович 27 червня 2024 10:00