Модель искусственного интеллекта (ИИ) с глубоким обучением может предсказывать пропущенные слова, фрагменты и предложения на клинописных табличках возрастом до 4500 лет.
Глиняные таблички с выгравированным клинописным текстом на аккадском языке являются ключевыми инструментами для понимания культур, существовавших в Месопотамии (более или менее на территории современного Ирака) между 2500 г. до н.э. и 100 г. н.э. Многие из этих табличек датируются эпохой, повреждены и отсутствуют ключевые разделы текста Габриэль Становский Еврейский университет в Иерусалиме и коллеги из разных отделов совместно использовали искусственный интеллект и разгадывали секреты этих табличек, дополняя недостающий клинописный текст.
Что такое клинопись
Клинопись — это система письма, использовавшаяся в древней Месопотамии. Он считается старейшей формой письма в мире и используется уже более 3.000 лет. Клинопись состоит из небольших клиновидных знаков, начертанных на влажных глиняных табличках.

Кодировать таблицы клинописью
В прошлом исследователи уже «читали» старые документы (письма эпохи Возрожденияили свитки геркуланума), но никогда с таким подходом к писаниям шумерской цивилизации.
Команда использовала модель искусственного интеллекта для глубокого обучения, уже обученную на 104 различных языках. К ним относятся некоторые семитские языки, такие как иврит, который имеет сходство с аккадским. Затем они обучили алгоритм, расшифровав 10.000 XNUMX табличек клинописью. Модель ИИ смогла предложить контекстуально точные слова и фразы, чтобы заполнить пробелы. Бери его как этакий Т9, но с месопотамским.
Как мы узнаем, что предложения актуальны? Исследователи также протестировали ИИ на уже известных частях планшетов, и там тоже все прошло отлично. Искусственный интеллект реконструировал предложения клинописи с потрясающей точностью 89%, в некоторых случаях даже расширяя возможные интерпретации текстов.

Важность знания языков
«Основной вывод этого исследования, — говорит Становский, — заключается в том, что использование других языков действительно помогло кодировать аккадский». Действительно, без предварительного обучения модели на этих 104 различных языках, точность чтения клинописных табличек была почти на 30 процентных пунктов ниже.
Это инструмент, который, я уверен, в ближайшие несколько лет раскроет огромный потенциал для расшифровки важных исторических документов.
Ссылки: arxiv.org/abs/2109.04513