Упс! Не вдала спроба:(
Будь ласка, спробуйте ще раз.

Оновлення Gemini та інші ШІ-продукти від Google — головне з Google I/O 2024

Олександр Тартачний
Олександр Тартачний журналіст
15 травня 2024 6 хвилин читання

На щорічній конференції Google I/O запропонував кілька нових інструментів на базі штучного інтелекту, зокрема генерацію відео, особистого помічника, платформу для синтезу музики та просунутий пошук у мережі. Водночас виступ техногіганта виглядав не так переконливо, як нещодавня презентація від OpenAI. SPEKA розповідає, що вдалося компанії, а що поки що залишається прототипом.    

Google I/O 2024: головне з презентації та нові можливості Gemini 1.5 Pro Google I/O 2024: головне з презентації та нові можливості Gemini 1.5 Pro

Що нового у ШІ-сервісах від Google

  • Головним помічником в Android може стати Gemini, яка тепер підтримує повноцінний діалог із співрозмовником. Також її можна перебивати або ж нагадувати про попередні фрагменти розмови. Про долю Google Assistant нічого не повідомляється, але його цілком можуть закрити як проєкт.
  • Google додає в пошук штучний інтелект. Gemini вже показує повністю згенеровані штучним інтелектом відповіді на більшість пошукових запитів у верхній частині сторінки для користувачів із США.
  • Google Photo аналізуватиме контекст фотографій. Можна буде не тільки шукати зображення за описом знятого, але й робити тематичні добірки за запитом.
  • Тепер Gmail надаватиме витяги з електронних листів, а також можна буде об’єднати кілька листів і створити з них зведення.
  • Запуститься Music AI Sandbox – інструмент для генерації музичного зразка на основі текстового опису або вхідної звукової доріжки.

Повна трансляція Google I/O 2024  

Нові можливості Gemini 1.5 Pro

Підписуйтеся на наші соцмережі

  • Оновлений застосунок Gemini 1.5 Flash. Цей продукт працює з текстом, зображенням, кодом, та іншими видами контенту. Наявний Gemini 1.5 Pro зараз використовують понад 1.5 млн розробників. Застосунок також працює із пошуком Google.
  • ШІ для освіти: система каталогізує та пояснює навчальний матеріал, у тому числі на побутових прикладах.
  • Контекстне вікно для Gemini Pro, яке стосується того, скільки інформації модель може розглянути в даному запиті, подвоюється до 2 мільйонів токенів, і Google каже, що модель краще виконує інструкції, ніж будь-коли.
  • Аналіз PDF-файлів до 1500 сторінок або відео тривалістю до 1 години.
  • Можливість генерації відео за запитом. Наразі тривалість до 1 хв, а система поки не доступна для використання.
  • Штучний інтелект підтримуватиме 35 мов і матиме найбільше контекстне вікно серед усіх конкурентів.
  • Захист від шахрайських дзвінків. ШІ аналізуватиме ваші розмови в режимі реального часу, і якщо співрозмовник поведеться підозріло, наприклад, попросить ваші банківські реквізити, подасть сигнал тривоги та попередить про можливе шахрайство.

Як та коли запрацюють Google Veo, Imagen 3 та Audio Overviews

Окрім апдейтів Gemini техкомпанія анонсувала «Veo», модель для створення відео за запитом та Imagen 3, покращену нейромережу перетворення тексту в зображення, яка обіцяє реалістичні зображення та «менше відволікаючих візуальних артефактів, ніж наші попередні моделі».

Однак схоже Google ще не впевнений у надійності продуктів. оскільки повноцінного доступу користувачі наразі не отримають. За словами представників компанії, інструменти будуть доступні для окремих творців у понеділок і з’являться на Vertex AI, платформі машинного навчання Google. Також щодо Imagen 3 то доступ лише по заявках та наявний не для всіх країн.  

Компанія також продемонструвала «Audio Overviews», здатність генерувати аудіообговорення на основі введення тексту. Наприклад, якщо користувач завантажує план уроку, чат-бот може озвучити його короткий зміст. 

Нові функції пошуку

Технологічний гігант запускає «AI Overviews» в Пошуку Google у понеділок у США. Огляди штучного інтелекту показують короткий підсумок відповідей на найскладніші запитання пошуку, за словами Ліз Рейд, керівника Пошуку Google. Також пошук зможе фільтрувати результати, які відповідають одразу кільком вимогам. Наприклад, вам потрібен ресторан схвалений місцевими, який можна відвідувати з тваринами та який має літню терасу, то AI Overviews врахує усі запити та надасть відповідь, яка відповідатиме усім вимогам. 

Google також повідомив, що почне тестувати здатність користувачів задавати запитання за допомогою відео. 

В одному прикладі Google показав, як хтось знімає зламаний програвач, запитуючи, чому він не працює. Пошук Google знайшов модель програвача та припустив, що він міг бути несправним через неправильне балансування.

Що таке проєкт Astra від Google та коли він запрацює

Проєкт Astra — це останній прогрес Google у розробці свого помічника зі штучним інтелектом, який створює підрозділ Google DeepMind AI. Наразі це лише прототип.

У демонстраційному відео, представленому на Google I/O, помічник — за допомогою відео та аудіо, а не через інтерфейс чат-бота — зміг допомогти користувачеві згадати, де він залишив окуляри, переглянути код і відповісти на запитання про те, що відбувається у кадрі.

Демонстрація сталася після демонстрації OpenAI подібної аудіорозмови з ChatGPT, за допомогою нової нейромережі GPT-4o. Сундар Пічаї (гендиректор Alphabet) сказав, що очікує запуску проєкту Astra в Gemini пізніше цього року. 

У Google заявили, що справді корисний чатбот повинен дозволяти користувачам «розмовляти з ним природно та без затримок». Розмова у демонстраційному відео відбувалася в реальному часі, без лагів. Хоча генеральний директор DeepMind Деміс Хассабіс сказав, що «скоротити час відповіді на реальну мову — складне інженерне завдання». У ЗМІ він також зазначав, що упродовж шести місяців пришвидшення системи було одним із найважливіших завдань команди.

Підписуйтеся на наші соцмережі

50 UAH 150 UAH 500 UAH 1000 UAH 3000 UAH 5000 UAH
0
Прокоментувати
Інші матеріали

Google починає співпрацю з Associated Press для інтеграції новин у реальному часі в Gemini

Вікторія Рудзінська 23 години тому

OpenAI тестує реєстрацію в ChatGPT за номером телефону без електронної пошти

Вікторія Рудзінська 15 січня 2025 22:05

Більше робочих місць чи скорочення: як штучний інтелект впливатиме на зайнятість

Олександр Тартачний 15 січня 2025 09:23

Штучний інтелект погіршує здатність до критичного мислення – дослідження

Вікторія Рудзінська 15 січня 2025 07:09

Кар’єра в IT: що змінилось для початківців у 2024-му

Вікторія Рудзінська 14 січня 2025 21:00