Подсказки для поиска

Внимательный

Внимающий

Спасибо за внимание

Принимая во внимание

Обратите внимание

От древнерусского до блогов: как изменился Национальный корпус русского языка после редизайна

Онлайн-журнал «Системный Блокъ» рассказал о масштабных нововведениях в НКРЯ: появились новые корпуса и новые функции.

Национальный корпус русского языка (НКРЯ) — ключевой инструмент для исследователей русского языка, литературы и словесной культуры. В 2019 году возникли опасения по поводу возможного закрытия сервиса, однако он не только продолжил свою работу, но и значительно расширился. Обновления включают как новый дизайн сайта, так и содержательные изменения.

Один из наиболее значимых новых корпусов — панахронический, который объединяет тексты разных исторических периодов (начиная со Средневековья и заканчивая современностью). Он позволяет исследователям формулировать запросы, охватывающие несколько веков развития русского языка. Унифицированные грамматические признаки облегчают поиск по различным формам слова. 

Новый корпус «Русская классика» включает в себя собрание сочинений русских авторов, в том числе разные редакции и даже черновики произведений. Кроме того, создан корпус детской литературы «От 2 до 15». Каждое произведение размечено по возрастам при помощи нейросетей. В корпус вошли 75 популярных произведений зарубежных и отечественных авторов.

Еще один интересный корпус — коллекция записей из блогов и социальных сетей. Он позволяет исследовать диалоговую природу текстов и выявить отличия между материалами блогов и текстами других корпусов. 

Нейросетевая программа «РуБик» отвечает за автоматическое снятие омонимии, что улучшило качество морфологической разметки. Добавление функции поиска коллокаций позволяет выявлять слова, которые часто встречаются вместе с заданными словами. Также появилась функция отображения частотности употребления слов и словосочетаний в выдаче. 

Эти и другие нововведения значительно расширяют возможности НКРЯ, делая его более удобным и функциональным инструментом для исследователей русского языка и текстовой культуры.

Портал «Грамота.ру»

Еще на эту тему

Вышла в свет книга археолога Стивена Митена «Загадка языка»

В ней утверждается, что язык возник примерно 1,6 млн лет назад

Как пришествие корпусов меняет лингвистику

Почему корпусная лингвистика не прижилась в 1960-х годах и почему переживает расцвет сейчас

«Давать» и «дарить»: какие слова можно считать однокоренными

Лингвист Борис Иомдин описывает два критерия, которыми могут пользоваться школьники

Как лингвисты проводят эксперименты: от интроспекции до Amazon

Какие инструменты они используют и где ищут участников, рассказывает «Системный Блокъ»

все публикации

Чем нас привлекают искусственные языки

Их создание и изучение помогает лучше понять границы естественного языка


Вышла в свет книга археолога Стивена Митена «Загадка языка»

В ней утверждается, что язык возник примерно 1,6 млн лет назад


Право на имя

Когда выбор способа называть человека или группу людей становится проблемой


Между эмбрионом и покойником: где расположены роботы на шкале одушевленности

Каждый месяц мы выбираем и комментируем три вопроса, на которые ответила наша справочная служба


Как пришествие корпусов меняет лингвистику

Почему корпусная лингвистика не прижилась в 1960-х годах и почему переживает расцвет сейчас


Эвфемизмы: от суеверий до политкорректности

«Благозвучные» слова используют не только вместо ругательств



Критический взгляд на текст: как увидеть искажения и ловушки

Чтобы лучше понимать прочитанное, нужно развивать читательскую грамотность


Новые возможности восприятия книг: что лучше, буквы или звуки?

Слуховое чтение набирает популярность, но для него все равно нужны письменные тексты


«Давать» и «дарить»: какие слова можно считать однокоренными

Лингвист Борис Иомдин описывает два критерия, которыми могут пользоваться школьники


Как лингвисты проводят эксперименты: от интроспекции до Amazon

Какие инструменты они используют и где ищут участников, рассказывает «Системный Блокъ»


«Я хочу продолжать работать с текстами»

История незрячего редактора Иоланты, которая благодаря цифровым технологиям может заниматься тем, что нравится


Наследие Михаила Панова и судьбы русской орфографии

Статья Владимира Пахомова в журнале «Неофилология» помогает осмыслить проблемы русского правописания


Праздники грамотности

Как в мире проверяют знание правил родного языка


Научный стиль: точность не в ущерб понятности

Им пользуются авторы учебников, исследователи, лекторы, научные журналисты


Самый важный предмет. Функциональный подход к обучению русскому языку

Лекция Марии Лебедевой для Тотального диктанта о роли языка в учебе и в жизни


Карточки Марины Королёвой вышли в виде книги «Русский в порядке»

Получился маленький словарь трудностей русского языка


Русский как индоевропейский: общие корни заметны даже у дальних родственников

На что обращают внимание лингвисты, когда сравнивают языки и выясняют их историю


«Победю» или «побежу»? Почему некоторые слова идут не в ногу

Сбои в парадигме могут возникать в результате конфликта разных правил


«Абонемент для абонента»: что такое паронимы и как их различать

Их любят поэты и рэперы, но ненавидят те, кто готовится к ЕГЭ