Як штучний інтелект забруднює інтернет і що з цим робити?
На початку цього року в мережі X неодноразово поширювали сексуальні зображення Тейлор Свіфт. Розмови про цей скандал не вщухають. Ці зображення, напевно, були створені за допомогою інструментів генеративного ШІ, що демонструє легкість, з якою цю технологію можна використати з брудною метою.
А ще були фейкові зображення арешту колишнього президента США Дональда Трампа, створені штучним інтелектом зображення темношкірих виборців, які підтримують Трампа, сфабриковані зображення доктора Ентоні Фаучі тощо.
Поки всі надихаються можливостями ШІ, а жертви здивовано розглядають власні світлини, яких вони не робили, деякі експерти б’ють на сполох. Ці зображення та відео поширюються у соцмережах та в інтернеті загалом, їх стає дедалі більше, і згодом інтернет перетвориться на звалище фейків, а звичайні користувачі не мають ресурсів на це вплинути.
Семантичний апокаліпсис
Письменник Ерік Хоел називає забруднення інтернету синтетичним контентом «семантичним апокаліпсисом».
«Тепер, коли генеративний ШІ знизив вартість виробництва лайна майже до нуля, ми чітко бачимо майбутнє інтернету — звалище сміття. Пошук у Google? Він часто видає фальшиві зображення, згенеровані штучним інтелектом, серед реальних речей. Пост у Twitter? Отримуєте відповіді від ботів, що продають порно. Але це лише очевидні речі», — пише він.
Підписуйтеся на наші соцмережі
ШІ-моделі в Instagram збирають сотні тисяч підписників, а люди відкрито рекламують послуги зі створення таких моделей. ШІ-музиканти заповнюють YouTube і Spotify. Наукові статті створюють за допомогою ШІ.
Відповідальність соцмереж
Науковий співробітник RSM у Центрі Беркмана-Кляйна у Гарварді та співробітник Ініціативи цифрового життя у Корнельському технологічному інституті Натаніель Лубін вважає, що Facebook, Instagram, TikTok, X, YouTube і Google Search визначають, як мільярди людей користуються інтернетом щодня. Для того щоб синтетичні медіафайли досягли мільйонів переглядів (як це сталося зі знімками Свіфт за лічені години), їм потрібні масивні, агреговані мережі, що дозволяють визначити початкову аудиторію, а потім поширювати їх. Оскільки кількість доступного контенту зростає завдяки ширшому використанню генеративного ШІ, роль соціальних мереж як кураторів стане ще важливішою.
Онлайн-платформи — це ринки уваги окремих користувачів. Користувачі можуть бачити набагато більше дописів, ніж вони мають час переглянути. Наприклад, в Instagram алгоритми Meta вибирають з незліченної кількості контенту кожну публікацію, яка фактично з’являється у стрічці користувача. Користувачі не матимуть більше часу для того, щоб відбирати контент, навіть якщо обсяг доступного для них контенту, зокрема згенерованого ШІ, стрімко зростатиме.
Щоб вирішити ці проблеми, платформи могли б змінити свої системи на користь людей, які створюють контент. Це звучить простіше, ніж є насправді, і технологічні компанії уже критикують за їхню роль у вирішенні того, кому приділяти увагу, а кому ні.
Як не перетворити інтернет на звалище?
Натаніель Лубін пропонує кілька варіантів розв’язання проблеми.
По-перше, платформи можуть зменшити свою надмірну увагу до залучення користувачів (кількість часу та активність користувачів за день або місяць). Можливо, найпростіший спосіб досягти цього — надалі надавати пріоритет прямим оцінкам контенту користувачами в алгоритмах ранжування. Інший спосіб — підвищити рейтинг зовнішньо перевірених авторів, наприклад, новинних сайтів, і знизити рейтинг акаунтів зловмисних користувачів.
Також можна розглянути можливість прямої інтеграції продуктів між платформами соціальних медіа та великими мовними моделями. Один із підходів — це зосередження на маркуванні: платформи поширення мають публічно позначати будь-який допис, створений за допомогою LLM.
Лише минулого місяця компанія Meta повідомила, що рухається у цьому напрямі, запровадивши автоматичне маркування дописів, які, як вона підозрює, були створені за допомогою інструментів генеративного ШІ, а також заохочуючи постерів самостійно повідомляти, чи використовували вони ШІ для створення контенту.
Але з часом це програшна пропозиція. Що кращими ставатимуть LLM, то менше людей зможуть відрізнити, що є справжнім, а що синтетичним.
На думку Еріка Хоела компанії не будуть саморегулюватися, враховуючи їхні величезні фінансові стимули.
Схоже, майбутнє цієї індустрії — глобальні регуляторні механізми, що збережуть порядок, але, як зазвичай, будуть стримувати розвиток. Поки цього немає, ми є свідками швидкого зростання ШІ у всіх сферах.