OpenAI видалятиме персональні дані користувачів за їхнім запитом. Як це працюватиме

OpenAI створив форму запиту для видалення персональних даних, яка дозволяє людям, переважно у країнах Європи та у Японії, просити про видалення інформації про них із систем OpenAI.
Форма допоможе видалити інформацію з відповідей, які ChatGPT надає користувачам, а не з навчальних даних. У ній потрібно вказати своє ім'я, електронну пошту, країну перебування, а також уточнити, чи подаєте ви заяву від себе, чи представляєте чиїсь інтереси і чи є ви публічною особою.
Після цього OpenAI попросить докази того, що його система згадує про вас. Він просить вас надати приклади запитів від вашого імені.
Підписуйтеся на наші соцмережі
«Щоб належним чином розглянути ваші запити, нам потрібні чіткі докази того, що модель має інформацію про суб’єкта даних, залежно від підказок», — йдеться у формі. Водночас OpenAI попереджає, що не у всіх випадках зможе видалити дані і за розгляду запитів збалансує «конфіденційність і свободу виявлення поглядів».

Як ChatGPT генерує свої відповіді та чи є у нього ваші персональні дані
ChatGPT і GPT-4 генерують свої відповіді, передбачаючи, які слова ймовірно слідуватимуть за іншими після того, як переглянули мільярди прикладів речень. Фактично це Т9 з вашого телефону, але «на стероїдах». Вчені називають такі технології мовними моделями (Language Models), а як вони працюють, ми докладно розповідали у матеріалі «Як працює ChatGPT: історія у схемах і мемах».
Коли у ChatGPT немає відомостей, він вигадає відповідь на основі подібних текстів. Натомість OpenAI не розповідає, на яких даних навчав свої великі мовні моделі, тому ніхто за межами компанії точно не знає, скільки та яких даних (разом з особистою інформацією людей) він зібрав у процесі.

OpenAI каже, що його великі мовні моделі навчаються на трьох джерелах інформації: дані, отримані з інтернету, дані, які компанія ліцензує в інших, та інформація, яку люди передають їй через чати. «Велика кількість даних в інтернеті стосується людей, тому наша навчальна інформація випадково містить особисту інформацію», — пояснює OpenAI у дописі, додаючи, що намагається зменшити її кількість.
Наклепи, брехня та фальшиві відомості — як відповіді ChatGPT призводили до скандалів
Схоже, форма, яку створив OpenAI є наслідком низки перевірок та низки скандалів із генератором тексту. Органи регулювання даних у всьому світі досліджують, як OpenAI збирав дані для навчання, точність відповідей, які він надає про людей, та інші юридичні проблеми щодо генеративного тексту. Європейські регулятори даних об’єднали зусилля, щоб розглянути OpenAI, після того як Італія тимчасово заборонила ChatGPT у країні. Потенційні ризики технології також досліджує Канада.
У Європі закони GDPR вимагають від компаній мати законні підстави для оброблення особистої інформації і надавати людям доступ до інформації про них та про те, як використовують їхню інформацію. У деяких випадках вони можуть вимагати видалити певні типи даних.
Водночас не лише люди стурбовані використанням даних. Samsung заборонив своїм співробітникам використовувати ChatGPT, частково через острах, що секрети компанії можуть бути розкриті іншим користувачам.