Создана российская нейросеть, читающая древние свитки «вслепую»

Специалисты из российской компании Smart Engines совместно с Федеральным исследовательским центром ИУ РАН создали искусственный интеллект (ИИ), который умеет читать старинные свитки и другие тексты, не разворачивая их. Благодаря этой разработке учёные надеются сохранить ценные манускрипты, а также артефакты, пострадавшие в результате старения.

Как пояснили разработчики в беседе с РИА Новости, новый ИИ способен извлекать содержимое хрупких манускриптов, печатных книг, а также берестяных и серебряных свитков, которые пострадали от пожаров или повышенной влажности. Дело в том, что если попытаться развернуть эти документы вручную, их можно повредить, а текст станет нечитаемым, не говоря уже о потере ценных исторических летописей.

Российская нейросеть умеет расшифровывать свитки, не раскрывая их, что очень важно для сохранности древних документов.
Российская нейросеть умеет расшифровывать свитки, не раскрывая их, что очень важно для сохранности древних документов.© Shutterstock

Для того, чтобы создать такую нейросеть, российские специалисты обучили алгоритмы машинного зрения на основе рентгеновской томографии. Сперва старинный документ помещают в томограф, а затем ИИ сканирует и реконструирует текст, создавая цифровую копию. Для обучения нейросети учёные компании создали собственный корпус данных на основе свёрнутых документов, цифр и схем с различными графическими элементами.

Исследователи надеются, что ИИ поможет сохранить культурное наследие и в то же время позволит историкам изучить старые тексты. Более того, новая нейросеть отличается от зарубежных аналогов тем, что она работает полностью в автоматическом режиме, а документ можно восстановить нажатием одной кнопки. Учёные планируют представить результаты своей работы на международной научной конференции в августе этого года.


Нам важно ваше мнение!

+0