Модель искусственного интеллекта (ИИ) с глубоким обучением может предсказывать пропущенные слова, фрагменты и предложения на клинописных табличках возрастом до 4500 лет.
Глиняные таблички с клинописным текстом на аккадском языке являются ключевыми инструментами для понимания культур, существовавших в Месопотамии (примерно на территории современного Ирака) между 2500 г. до н. э. и 100 г. н. э. Многие из этих табличек, учитывая возраст, являются повреждены и отсутствуют ключевые разделы текста. Ученый-компьютерщик Габриэль Становский из Еврейского университета в Иерусалиме и коллеги из разных отделов совместно использовали искусственный интеллект, чтобы раскрыть секреты этих таблиц и дополнить недостающий клинописный текст.
Что такое клинопись
Клинопись — система письма, использовавшаяся в древней Месопотамии. Он считается старейшей формой письма в мире и используется уже более 3.000 лет. Клинопись состоит из небольших клиновидных знаков, которые наносились на влажные глиняные таблички.
Кодировать таблицы клинописью
В прошлом исследователи уже «читали» старые документы (письма эпохи Возрожденияили свитки геркуланума), но никогда с таким подходом к писаниям шумерской цивилизации.
Команда использовала модель искусственного интеллекта глубокого обучения, уже обученную на 104 различных языках. К ним относятся некоторые семитские языки, такие как иврит, который имеет сходство с аккадским. Затем они обучили алгоритм, расшифровав 10.000 XNUMX клинописных табличек. Модель ИИ смогла предложить контекстуально точные слова и фразы, чтобы заполнить пробелы. Бери его как этакий Т9, но с месопотамским.
Как мы узнаем, что предложения актуальны? Исследователи также протестировали ИИ на уже известных частях планшетов, и там тоже все прошло отлично. Искусственный интеллект реконструировал предложения клинописи с потрясающей точностью 89%, в некоторых случаях даже расширяя возможные интерпретации текстов.
Важность знания языков
«Главный вывод этого исследования, — говорит Становский, — заключается в том, что использование других языков действительно помогло систематизировать аккадский язык». Действительно, без предварительного обучения модели на этих 104 различных языках точность чтения клинописных табличек была почти на 30 процентных пунктов ниже.
Это инструмент, который, я уверен, в ближайшие несколько лет раскроет огромный потенциал для расшифровки важных исторических документов.
Ссылки: arxiv.org/abs/2109.04513