Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

Нейросеть помогает работать с церковнославянскими рукописями

Нейросеть помогает работать с церковнославянскими рукописями
В коллаже использованы материалы фотобанка Unsplash

Сотрудники Лаборатории цифровой лингвистики МИФИ Александра Плетнева и Дмитрий Демидов рассказали изданию «Горький», как можно с помощью искусственного интеллекта упростить обработку и изучение рукописей на церковнославянском языке. 

До нас дошел очень большой массив рукописей на церковнославянском языке, но у сотрудников библиотек не хватает времени, чтобы оцифровать весь этот огромный материал, что делает его недоступным для исследователей. Новые технологии, прежде всего нейросети, позволяют получить картину бытования и изменения этих текстов, показать, какой вариант текста первичен, в какое время он изменялся в результате редактирования и т. д. 

Распознанные церковнославянские тексты представляют большую ценность для обучения нейросетей, тестирования новых программных средств и методик. Однако пока отсутствует база данных с таким объемом текстов, чтобы к ним можно было применять корпусные методы. Лаборатория цифровой лингвистики МИФИ работает над созданием такой базы совместно с Институтом русского языка им. В. В. Виноградова РАН (Дмитрий Демидов — кандидат технических наук, доцент МИФИ, Александра Плетнева — кандидат филологических наук, ведущий научный сотрудник Научного центра по изучению церковнославянского языка ИРЯ РАН). 

В будущем, вероятно, лингвисты совместно с программистами научат нейросеть различать манеры разных писцов, чтобы решать вопросы палеографии (например, датировку) и определять начертания, которые характерны для конкретных эпох и авторов. Большая сложность заключается в том, что в церковнославянском много надстрочных символов, диакритических знаков. А еще внутри текста бывают особые значки — указания для церковного пения, своего рода язык в языке. Эти символы необходимо сохранить, а чтобы прочесть их, нужны особые методы сегментации. 

Распознанные тексты можно будет превратить в будущем в электронные издания, которые будут интересны не только узким специалистам, но и всем, кто интересуется старыми текстами и хочет посмотреть, как выглядели книги в XII, XVII или XVIII веке. 

Портал «Грамота.ру»

Еще на эту тему

Как читать «Сказание о Борисе и Глебе»

Андрей Ранчин — об одном из основополагающих текстов русской духовной культуры

все публикации

Чем нас привлекают искусственные языки

Их создание и изучение помогает лучше понять границы естественного языка


Вышла в свет книга археолога Стивена Митена «Загадка языка»

В ней утверждается, что язык возник примерно 1,6 млн лет назад


Право на имя

Когда выбор способа называть человека или группу людей становится проблемой


Между эмбрионом и покойником: где расположены роботы на шкале одушевленности

Каждый месяц мы выбираем и комментируем три вопроса, на которые ответила наша справочная служба


Как пришествие корпусов меняет лингвистику

Почему корпусная лингвистика не прижилась в 1960-х годах и почему переживает расцвет сейчас


Эвфемизмы: от суеверий до политкорректности

«Благозвучные» слова используют не только вместо ругательств



Критический взгляд на текст: как увидеть искажения и ловушки

Чтобы лучше понимать прочитанное, нужно развивать читательскую грамотность


Новые возможности восприятия книг: что лучше, буквы или звуки?

Слуховое чтение набирает популярность, но для него все равно нужны письменные тексты


«Давать» и «дарить»: какие слова можно считать однокоренными

Лингвист Борис Иомдин описывает два критерия, которыми могут пользоваться школьники


Как лингвисты проводят эксперименты: от интроспекции до Amazon

Какие инструменты они используют и где ищут участников, рассказывает «Системный Блокъ»


«Я хочу продолжать работать с текстами»

История незрячего редактора Иоланты, которая благодаря цифровым технологиям может заниматься тем, что нравится


Наследие Михаила Панова и судьбы русской орфографии

Статья Владимира Пахомова в журнале «Неофилология» помогает осмыслить проблемы русского правописания


Праздники грамотности

Как в мире проверяют знание правил родного языка


Научный стиль: точность не в ущерб понятности

Им пользуются авторы учебников, исследователи, лекторы, научные журналисты


Самый важный предмет. Функциональный подход к обучению русскому языку

Лекция Марии Лебедевой для Тотального диктанта о роли языка в учебе и в жизни


Карточки Марины Королёвой вышли в виде книги «Русский в порядке»

Получился маленький словарь трудностей русского языка


Русский как индоевропейский: общие корни заметны даже у дальних родственников

На что обращают внимание лингвисты, когда сравнивают языки и выясняют их историю


«Победю» или «побежу»? Почему некоторые слова идут не в ногу

Сбои в парадигме могут возникать в результате конфликта разных правил


«Абонемент для абонента»: что такое паронимы и как их различать

Их любят поэты и рэперы, но ненавидят те, кто готовится к ЕГЭ