ЦХИНВАЛ, 3 июн - Sputnik. Российские ученые обучили искусственный интеллект читать хрупкие свитки и книги нажатием одной кнопки, не раскрывая их, это поможет сохранить ценные старинные источники и снизить риски их повреждения, сообщило РИА Новости со ссылкой на компанию-разработчика этой технологии Smart Engines (SE).
Это первая полностью автоматическая система виртуального разворачивания свитков, не требующая вмешательства человека
"Ученые российской компании Smart Engines и ФИЦ ИУ РАН (Федерального исследовательского центра "Информатика и управление" РАН – ред.) обучили искусственный интеллект извлекать содержимое хрупких свитков, не разворачивая их. Теперь получить восстановленный текст из манускрипта можно нажатием одной кнопки. Разработка позволит изучать тексты бумажных, берестяных и серебряных свитков и печатных книг, которые пострадали вследствие естественного старения, воздействия влажности или пожаров, и хранятся в особых условиях", - говорится в сообщении.
Как рассказали в компании, российские исследователи применили неразрушающий метод рентгеновской томографии и алгоритмы машинного зрения: объект, который нельзя разворачивать, помещается в томограф. Затем реконструируется цифровая копия документа, над которой и производятся все дальнейшие манипуляции.
В SE подчеркнули, что мировое научное сообщество уже более 20 лет пыталось решить более двадцати лет проблему анализа старых свитков с привлечением томографии, предлагая разные подходы с машинным обучением. При этом вопрос полной автоматизации процесса до сегодняшнего дня никому не удавалось решить.
Для обучения новой нейросети использовался созданный учеными Smart Engines корпус данных, включающий шесть образцов свернутых разными способами документов. На них были нанесены буквы и цифры разного размера и схемы с различными графическими элементами.
"Мы надеемся, что наша разработка позволит сделать шаг на пути исследования и сохранения культурного наследия и откроет новые возможности для историков, археологов и других специалистов в области гуманитарных наук. Сейчас мы активно ищем партнеров для проведения дальнейших исследований", – рассказал гендиректор Smart Engines, доктор технических наук Владимир Арлазаров.
Ожидается, что результаты работы по данному проекту будут представлены российскими учёными в августе 2024 года на The International Conference on Document Analysis and Recognition (ICDAR) – ведущей международной научной конференции в области анализа и распознавания документов (Афины, Греция).