Упс! Не вдала спроба:(
Будь ласка, спробуйте ще раз.

Машинне навчання розшифрує рукописи Геркуланумської бібліотеки та втрачену стародавню літературу — як це працює

Олександр Тартачний
Олександр Тартачний журналіст
17 березня 2024 7 хвилин читання

Як машинне навчання та сучасні технології допомагають працювати з історичними пам’ятками та розшифровувати давні артефакти. Доцент Манітобського університету Майкл Семпсон для The Conversation розповідає про головні технологічні новації в археології та історії. SPEKA переповідає головне з матеріалу. 

Як машинне навчання допомагає відновити втрачену літературу 

Нещодавно було зроблено революційну заяву про відновлення втраченої стародавньої літератури. Використовуючи неінвазивний (без безпосереднього втручання та контакту) метод, який використовує машинне навчання, троє вчених витягли 15 колонок давньогрецького тексту з карбонізованого папірусу з Геркуланума, давньоримського міста за вісім кілометрів на південний схід від Неаполя.

Їхні досягнення принесли їм головний приз у розмірі $700 тис. від Vesuvius Challenge — фахового хакатону з відновлення давньої літератури за допомогою машинного зору. 

Vesuvius Challenge виник завдяки співпраці між комп’ютерним науковцем Брентом Сілсом та інвесторами у технології Натом Фрідманом і Деніелом Гроссом. Сілс у 2015 році за допомогою рентгенівської томографії та комп’ютерного зору прочитав сувій Ен-Геді, не відкриваючи його. Сувій, знайдений поблизу Мертвого моря в Ізраїлі, містить текст із книги Левіт. 

«Виверження Везувію», Йохан Крістіан Даль (1824),музей Метрополітен «Виверження Везувію», Йохан Крістіан Даль (1824),музей Метрополітен

Хоча це звучить захопливо, технології є лише частиною прогресу науки. Робота з читання й аналізу нових грецьких і латинських текстів, знайдених із папірусів, ляже на плечі людей.

Що таке Геркуланумська бібліотека та яке значення вона має для історії 

Як і Помпеї, Геркуланум був похований катастрофічним виверженням вулкана Везувій у 79 році нашої ери.

Значна частина стародавнього міста залишається під землею. Але у 1752 році під час розкопок знайшли сотні сувоїв папірусу в бібліотеці римської вілли. Геркуланумські папіруси є найбільшим збереженим прикладом неушкодженої стародавньої бібліотеки, що зберігся в археологічних документах: бібліотеку знайшли такою, якою вона існувала у 79 році нашої ери.

Точна кількість книг невідома, каже Майкл МакОскер, науковий співробітник з папірології в Університетському коледжі Лондона, і різні методи оцінки дають різні результати.

Брак кисню та інтенсивна спека Везувію карбонізувала (але не запалювала) папіруси. На вигляд сувої схожі на шматки вугілля, а тому копачі XVIII століття не відразу розпізнали їх як стародавні книги.

Вигляд збоку на нерозкритий папірус з Геркуланума Вигляд збоку на нерозкритий папірус з Геркуланума

Папіруси настільки крихкі, що багато з них були знищені під час ранніх спроб отримати доступ до їхніх текстів. Тому їхнє вивчення завжди вимагало винахідливості. У 1754 році працівник бібліотеки Ватикану винайшов машину для повільного їх розгортання.

Частина розгорнутого папірусу з Геркуланума в Оксфордській бібліотеці Частина розгорнутого папірусу з Геркуланума в Оксфордській бібліотеці

Останнім часом мультиспектральна фотографія різко покращила їх розбірливість. Але досі неінвазивний метод, який би залишав сувої недоторканими, залишався недосяжним. Його розвиток знаменує значний прорив.

МакОскер зазначає, що у каталозі є 659 предметів, зазначених як «нерозгорнуті», але деякі з них є частинами сувоїв.

Як машинний зір та рентген змінюють підхід до дослідження історії

Щоб розпочати конкурс Vesuvius Challenge, Сілс оприлюднив масив рентгенівської комп’ютерної томографії (КТ) з високою роздільною здатністю двох сувоїв, а також аналогічних сканів відокремлених фрагментів із видимим чорнилом. Останні важливі як орієнтир для інноваційних підходів.

Поперечний розріз внутрішньої частини сувою, який читають учасники Vesuvius Challenge. Поперечний розріз внутрішньої частини сувою, який читають учасники Vesuvius Challenge.

Дизайн конкурсу заохочував прозорість і співпрацю: дані, опубліковані для досягнення менших цілей, принесли користь усім конкурентам. Крім того, прозорість уможливила незалежну перевірку результатів. Команди об’єдналися навколо спільних ідей та підходів до проблеми.

Челендж потрапив у новини в жовтні, коли були прочитані перші літери: πορφυρας (іменник або прикметник, що містить «фіолетовий»).

На кінець 2023 року критерії для присудження головного призу були виконані: чотири уривки по 140 символів, із відновленими 85% літер. Переможцями були оголошені аспірант, який вивчає машинне навчання, інженер, який вивчає інформатику, і студент-робототехнік.

За словами МакОскера, у тексті, який вони знайшли, двічі згадується музика, а також відчуття смаку та зору. Він вважає, що це, швидше за все, твір про відчуття та прийняття рішень у традиції філософа Епікура (341–270 рр. до н. е.). Папірологічна команда (займається вивченням давніх документів, з метою реконструкції текстів та історичного контексту античного та ранньосередньовічного світів — ред.) все ще аналізує це дані, які розшифрувала технологія переможців.

Чому машинне навчання не здатне подолати всі виклики з відновлення втраченої літератури

Цей рік приносить із собою нові цілі: після того як у 2023 році прочитали 5% одного сувою, у 2024-му прочитали 90% чотирьох сувоїв. Оскільки сотні рулонів ще належить вивчити, новий метод відновлення вмісту папірусів Геркуланума лише починається.

Але кілька перешкод залишаються. Виробництво сканів з достатньо високою роздільною здатністю не можна зробити за допомогою звичайного обладнання та вимагає доступу до установки з прискорювачем частинок. Доступ до потрібного обладнання обмежений і дорогий. На сьогодні чотири сувої та численні відокремлені фрагменти були оброблені у науковому центрі поблизу Оксфорда в Англії.

Більшість нерозкритих сувоїв зберігається в Неаполі, і безпечно доставити їх до Оксфорда буде складно.

Іншим обмеженням є те, що технологія розгортання та розрівнювання папірусу віртуальними засобами — процес, який називають «сегментацією», — повільна та дорога. Завдяки сучасним технологіям, які передбачають певну кількість ручних маніпуляцій, повна сегментація одного сувою коштуватиме $1-5 млн. Сегментація має стати набагато ефективнішою, щоб уникнути вузьких місць.

Щобільше, технологія — це лише частина рівняння. Важливу роль у роботі виклику відіграє міжнародна команда папірологів. Їхня роль полягає в тому, щоб проаналізувати результати моделі на розбірливій давньогрецькій мові — і при цьому визначити, які підходи є найбільш ефективними.

Папірологія – це захоплива робота, але водночас складна та копітка. Вона вимагає володіння стародавніми мовами та ідеями, а також уміння розгадувати головоломки заповнювати неминучі прогалини. Папірологія — це нішева спеціалізація: у великому світі папірологи — рідкісні птахи. Фахівців з бібліотеки Геркуланума ще менше.

Тобто для того, щоб розшифрувати давню літературу, нам знадобляться критичний розум, а також потужні технології. Потенційно існує чимало нової стародавньої філософії, але її потрібно зібрати разом у послідовний текст — літеру за літерою, слово за словом, речення за реченням, перш ніж її можна буде вивчати ширше. Для цього будуть потрібні науковці.

0
Прокоментувати
Інші матеріали

Чому бізнес замінює персонал на ботів із штучним інтелектом

Олександр Тартачний 10 травня 2024 12:18

Google заплатить News Corp за контент для ШІ до $6 млн на рік

Кіра Іванова 30 квітня 2024 17:47

Зекономити мільярди: як штучний інтелект допомагає створювати ліки

Олександр Тартачний 10 квітня 2024 16:00

Знахідка в каналізації: археологи виявили гробницю шляхти у Македонії

Олена Черкасець 7 квітня 2024 09:19

Під Любліном вчені знайшли найдавнішу мідну сокиру

Дмитро Мухін 6 квітня 2024 20:19