Упс! Не вдала спроба:(
Будь ласка, спробуйте ще раз.

OpenAI визнав, що його бот GPTbot сканує інтернет для навчання ШІ

Кіра Іванова
Кіра Іванова Редакторка новин The Page/SPEKA
9 серпня 2023 2 хвилин читання

Компанія OpenAI визнала, що має спеціального бота-”павука” GPTbot, який сканує мережу та збирає дані для навчання свого штучного інтелекту, повідомляє Business Insider.

OpenAI може використовувати онлайн-контент, зібраний GPTbot, для навчання наступної великої моделі ШІ – GPT-5.

GPT-4, ChatGPT та інші потужні моделі відповідають на запитання миттєво, тому користувачі мають менше стимулів шукати першоджерела інформації. 

Так само у авторів зникають стимули ділитися високоякісною інформацією в Інтернеті безкоштовно: OpenAI збере цей контент для навчання майбутніх LLM.

Як захистити свій сайт від індексації GPTbot 

Підписуйтеся на наші соцмережі

Деякі автори, медіа та навіть онлайн-спільноти вже дійшли висновку, що, дозволивши боту GPTbot від OpenAI сканувати свій сайт, вони втрачають власний майбутній трафік. 

OpenAI нещодавно фактично визнала існування цього боту – оголосила про спосіб блокування GPTbot за допомогою загального протоколу під robots.txt. 

Для цього потрібно додати в файл robots.txt наступні строки:

  • User-agent: GPTBot
  • Disallow: /
OpenAI оголосила про спосіб блокування GPTbot за допомогою загального протоколу під robots.txt OpenAI оголосила про спосіб блокування GPTbot за допомогою загального протоколу під robots.txt

Деякі сайти, наприклад Clarkesworld, журнал наукової фантастики та фентезі, вже скористались цим протоколом та заблокували GPTbot. Щоправда, це може бути запізно.

«Нарешті, після того, як увібрали весь ваш контент, захищений авторським правом, для створення свого власного продукту, OpenAI дає вам спосіб запобігти використанню вашого контенту для подальшого вдосконалення продукту»
Прасад Дхумал, консультант з оптимізації пошукових систем

GPTbot – не єдиний індекс-бот для ШІ. Ще один цифровий павук CCBot  збирає весь вміст мережі. Його власник – організація Common Crawl, яка є основним постачальником навчальних даних для моделей ШІ. Common Crawl регулярно зберігає всю цю інформацію, тому блокувати її бота також вже пізно. 

Підписуйтеся на наші соцмережі

50 UAH 150 UAH 500 UAH 1000 UAH 3000 UAH 5000 UAH
0
Прокоментувати
Інші матеріали

Компанія LG представила пакет програм до програмнокерованих транспортних засобів

Владислав Паливода 1 годину тому

YouTube Music тестує новий інструмент створення списків відтворення за допомогою ШІ

Вікторія Рудзінська 16 годин тому

ШІ-асистент для відеопрезентацій: Google запускає Vids у Workspace Labs

Вікторія Рудзінська 16 годин тому

«До того як OpenAI зможе досягти того рівня, який ми вже маємо, ми будемо глибоко інтегровані в mining-індустрію»: інтерв’ю з COO Beholder Даніїлом Лубкіним

Анна Сергієнко 15 липня 2024 18:03

Alphabet хоче купити кібербезпековий стартап Wiz

Олеся Дерзська 15 липня 2024 17:06