Головна OpenAI

OpenAI використала понад мільйон годин відео з YouTube для навчання GPT-4

50 UAH 150 UAH 500 UAH 1000 UAH 3000 UAH 5000 UAH

7 квітня 2024 2 хвилин читання

Компанія OpenAI використовувала модель транскрипції аудіо Whisper, щоб розшифрувати понад мільйон годин відео з YouTube для збору даних для навчання GPT-4.

Про це повідомляє The New York Times.

За інформацією видання, OpenAI вичерпала запаси традиційних навчальних даних ще у 2021 році. Тоді компанія обговорювала можливість транскрибування відео з YouTube, подкастів та аудіокниг.

Попри юридичну сумнівність такого кроку, керівництво OpenAI, зокрема президент Ґреґ Брокман, особисто брали участь у зборі відео для цієї мети. Компанія виправдовувала свої дії концепцією «чесного використання» в рамках закону про авторські права.

Підписуйтеся на наші соцмережі

Представниця OpenAI Ліндсі Хелд підтвердила, що компанія збирає «унікальні» набори даних для кожної моделі, використовуючи як публічні, так і партнерські непублічні джерела. Також розробники розглядають можливість створення власних синтетичних даних.

OpenAI порушила правила YouTube?

З боку Google така діяльність розцінюється як порушення. Раніше компанія попереджала, що її правила Умов використання забороняють несанкціоноване завантаження контенту з YouTube для навчання ШІ.

Разом з тим, за даними The Times, Google також збирала стенограми з власної відеоплатформи для тренування штучного інтелекту. Однак, за їхніми словами, це відбувалося в рамках угод з авторами контенту.

Інші технологічні гіганти, як-от Meta, також розглядали можливість непублічного використання авторських творів для навчання своїх моделей ШІ через обмежену доступність якісних відкритих даних.

Раніше SPEKA писала, що OpenAI оновила GPT-4 Turbo актуальними даними 2023 року.

Підписуйтеся на наші соцмережі

50 UAH 150 UAH 500 UAH 1000 UAH 3000 UAH 5000 UAH

Інші матеріали

Meta заборонили тренувати моделі ШІ на даних бразильських користувачів

Вікторія Рудзінська 8 годин тому

Бразильський регулятор захисту даних (ANPD) заборонив Meta тренувати свої моделі штучного інтелекту на бразильських персональних даних, посилаючись на «ризики серйозної шкоди та труднощів для користувачів».

Meta заборонили тренувати моделі ШІ на даних бразильських користувачів

У Києві відбудеться конференція «Навігатори інновацій. Змінюй правила гри»

Ольга Топольська 10 годин тому

Juscutum у партнерстві з IT Ukraine Association запрошують на масштабний захід «Навігатори інновацій. Змінюй правила гри»

У Києві відбудеться конференція «Навігатори інновацій. Змінюй правила гри»

Mastodon додав зручну функцію для підписки на журналістів

Владислав Паливода 15 годин тому

Соціальна мережа Mastodon запускає нову функцію, яка зробить більш зручним доступ до новин та інформації. Відтепер з'явиться посилання на автора, яке спрямує користувача на його статті, пише TechCrunch.

Mastodon додав зручну функцію для підписки на журналістів

Meta демонструє ШІ-інструмент 3D Gen для швидкої генерації текстурованих 3D-моделей

Вікторія Рудзінська 2 липня 2024 20:37

Meta представила новий інструмент штучного інтелекту 3D Gen, що дозволяє створювати або ретекстурувати 3D-об'єкти на основі текстових підказок швидше, ніж будь-коли раніше.

Meta демонструє ШІ-інструмент 3D Gen для швидкої генерації текстурованих 3D-моделей

Figma тимчасово вимикає функцію ШІ через проблеми з копіюванням дизайнів

Вікторія Рудзінська 2 липня 2024 19:44

Figma вирішила тимчасово вимкнути свою нову функцію штучного інтелекту «Make Design» після того, як було виявлено, що вона копіює дизайни інших застосунків.

OpenAI використала понад мільйон годин відео з YouTube для навчання GPT-4

Підписуйтеся на наші соцмережі

OpenAI порушила правила YouTube?

Підписуйтеся на наші соцмережі

Будь в курсі зі SPEKA

Дякуємо, що підписалися на SPEKA. Буде гаряче!

Meta заборонили тренувати моделі ШІ на даних бразильських користувачів

У Києві відбудеться конференція «Навігатори інновацій. Змінюй правила гри»

Mastodon додав зручну функцію для підписки на журналістів

Meta демонструє ШІ-інструмент 3D Gen для швидкої генерації текстурованих 3D-моделей

Figma тимчасово вимикає функцію ШІ через проблеми з копіюванням дизайнів