OpenAI почав розгортати розширений голосовий режим ChatGPT
OpenAI анонсував розгортання розширеного голосового режиму ChatGPT, що надає користувачам доступ до реалістичних аудіовідповідей GPT-4o.
Про це повідомляє TechCrunch.
Бета-версія буде доступна невеликій групі користувачів ChatGPT Plus від 20 липня, і OpenAI каже, що ця функція буде поступово розгортатися для всіх користувачів Plus восени 2024 року.
Коли OpenAI вперше продемонстрував голос GPT-4o у травні, функція шокувала аудиторію швидкими відповідями та дивною схожістю з реальним людським голосом — зокрема голос, Скай, нагадував голос Скарлетт Йоханссон.
Підписуйтеся на наші соцмережі
Актриса відмовилася від кількох запитів CEO OpenAI Сема Альтмана використовувати її голос, і, побачивши демонстрацію GPT-4o, найняла юристконсульта, щоб захистити свій голос. OpenAI заперечував використання голосу Йоханссон, але пізніше видалив голос, показаний у демонстрації. У червні компанія заявила, що відкладе випуск розширеного голосового режиму, щоб покращити свої заходи безпеки.
Через місяць очікування завершилося. OpenAI заявляє, що можливості обміну відео та екраном, продемонстровані під час весняного оновлення, не будуть частиною цієї бета-версії, бо це буде запущено «пізніше». Наразі демонстрація GPT-4o, яка вразила всіх, все ще є лише демонстрацією, але деякі преміум-користувачі тепер матимуть доступ до голосової функції ChatGPT, показаної там.
OpenAI також стверджує, що GPT-4o може відчувати емоційні інтонації у вашому голосі, включаючи смуток, хвилювання або спів.
OpenAI каже, що поступово випускає новий голос ChatGPT, щоб уважно стежити за його використанням. Люди в бета-групі отримають сповіщення в додатку ChatGPT, а потім електронний лист з інструкціями щодо його використання.
За місяці після демонстрації OpenAI компанія заявляє, що протестувала голосові можливості GPT-4o з більш ніж 100 зовнішніми червоними командами, які розмовляють 45 різними мовами. OpenAI каже, що звіт про ці зусилля з безпеки з'явиться на початку серпня. Компанія каже, що розширений голосовий режим буде обмежений чотирма попередньо встановленими голосами ChatGPT — Juniper, Breeze, Cove та Ember — створеними у співпраці з платними акторами озвучування.