Сотрудники Лаборатории цифровой лингвистики МИФИ Александра Плетнева и Дмитрий Демидов рассказали изданию «Горький», как можно с помощью искусственного интеллекта упростить обработку и изучение рукописей на церковнославянском языке.
...Электронные издания старых книг могут заменить архивы...
...Сотрудники Лаборатории цифровой лингвистики МИФИ Александра...
...До нас дошел очень большой массив рукописей на церковнославянском языке, но у сотрудников библиотек не хватает времени, чтобы оцифровать весь этот огромный материал, что делает его недоступным для исследователей....
...Нейросеть помогает работать с церковнославянскими рукописями...
Девятнадцать лет назад в России появился электронный онлайн-корпус русскоязычных текстов. Сегодня этот корпус — Национальный корпус русского языка, или НКРЯ — насчитывает больше двадцати отдельных корпусов и более двух миллиардов словоупотреблений. На вопросы Грамоты о том, какую роль играет НКРЯ в лингвистической науке и не только, ответили менеджер НКРЯ, старший научный сотрудник Института русского языка им. В. В. Виноградова РАН, и. о. заведующей лабораторией цифровой документации русского языка ИППИ РАН, кандидат филологических наук Анастасия Козеренко и продакт-менеджер компании «Яндекс», кандидат технических наук Ирина Виноградова.
...Получить всю картотеку одним кликом и другие, менее...
...Девятнадцать лет назад в России появился электронный...
...Ему не нужно прочитывать огромное количество текстов и выписывать эти глаголы, достаточно сформулировать запрос, и огромный массив примеров будет в его распоряжении.Анастасия Козеренко Со времени появления корпуса все лингвистические работы по русистике в той или иной степени используют корпусные данные...
... Если бы мы в основной корпус загрузили все собрания сочинений, этот огромный массив перевесил бы все остальное; мы получили бы не корпус русского языка, а корпус языка писателей-классиков.Анастасия Козеренко В основной корпус включены только некоторые тексты разных авторов, а в корпусе...
...Кому и зачем нужен Национальный корпус русского языка...
Проект «Слово Толстого» — цифровой путеводитель по наследию писателя, справочно-информационная платформа, созданная на основе 90-томного cобрания сочинений Льва Толстого. Это первый проект такого рода: он дает возможность осуществлять поиск по огромному корпусу текстов Толстого, обеспечивает удобную навигацию по ним и предоставляет справочные, корпусные и словарные материалы для профессионалов и для широкой аудитории читателей. Технологии Digital Humanities, примененные на ...
...Комментарии участников проекта...
...Важно, что первый подобный проект осуществлен именно на материале наследия Толстого, учитывая его огромный объем, жанровое и стилистическое разнообразие, широту интересов писателя, а также то, что Толстой сам выступал за свободное и широкое распространение своих произведений....
...Состоялся запуск масштабного цифрового проекта «Слово...
Вопрос о возможности заменить отчество на матчество в официальных документах вызывает сегодня бурные дискуссии, хотя это явление не так чуждо русской культуре, как может показаться.
...Лексические единицы, связанные с гендером, не ограничиваются...
...Вопрос о возможности заменить отчество на матчество...
... Для Капаловой эта история — про обеспечение равных прав: «Я выросла в традиционной семье, у меня хорошие родители, папа сделал огромный вклад в меня, но это не значит, что мама сделала меньше....
...Фамилия, имя... матчество?...
22 ноября отмечается День словарей и энциклопедий. Это день рождения Владимира Даля, создателя «Толкового словаря живого великорусского языка», внесшего огромный вклад в развитие русского языка и российской лексикографии. В 2016 году Институт русского языка им. В. В. Виноградова создал научно-информационный орфографический ресурс «Академос», который постоянно пополняется. В 2023 году в него было добавлено более ста новых статей. Среди них есть слова и ...
...Рассказываем о них в День словарей и энциклопедий...
...Это день рождения Владимира Даля, создателя «Толкового словаря живого великорусского языка», внесшего огромный вклад в развитие русского языка и российской лексикографии. В 2016 году Институт русского языка им. В. В....
...В орфографический ресурс «Академос» добавили более...
Книги о русском языке для дошкольников найти гораздо сложнее, чем, например, по математике. Мы часто не готовы говорить с ребенком о том, как устроен язык: сначала еще рано, он не поймет, а перед школой уже некогда — нужно работать над чтением и произношением. Но сейчас мы — о любви, о том, что узнавать слова, сравнивать их, играть с ними — это интересно. Подарите эти книжки дошкольнику, а потом почитайте их вместе, чтобы разделить с ним удовольствие.
...Слова нужны не только для общения, они могут удивлять...
...Книги о русском языке для дошкольников найти гораздо...
...Все бегут, летят и скачут В поэзии Хармса есть ритм и особая графическая форма, звукопись и игра — все это позволяет увидеть мир как огромный цирк или театр марионеток, где ты сам можешь стать фокусником....
...Детские книги, которые пробуждают любопытство к языку...
Русское правописание за десять с лишним веков менялось много раз, но, говоря о реформе орфографии, мы всегда имеем в виду реформу 1917 года. При этом внесенные в правописание изменения обсуждались русскими лингвистами задолго до самой реформы.
...Как Петр I и большевики с буквами воевали...
...Русское правописание за десять с лишним веков менялось...
...Многие сетовали, что нужно заучивать огромный список слов, где должна писаться буква «ять», которая по произношению ничем не отличается от «е». Другим не нравился ер в конце слов — он ведь не читается....
...Реформы русской орфографии...
В статье рассматриваются проблемы теории и истории языкознания рубежа XIX–XX веков, получившие развитие в трудах видного лингвиста Дмитрия Николаевича Кудрявского (1867–1920). Автор обращает особое внимание на обзор научных идей, изложенных в новаторском курсе лекций «Введение в языковедение», их связь с новыми тенденциями в отечественной и мировой науке начала XX века и подчеркивает их значение для осмысления последующей лингвистической традиции в России. В статье приведены также малоизвестные факты сотрудничества Д. Н. Кудрявского с «Энциклопедическим словарем» Брокгауза и Ефрона.
...О забытом русском лингвисте Дмитрии Кудрявском...
...В статье рассматриваются проблемы теории и истории...
... Кудрявский приводил наиболее яркие нерукотворные создания человеческого природного духа языка: «Так[,] слова огромадный (из огромный и громадный), сродственник (из сродник и родственник) очень часто встречаются в просторечии....
...«Справедливый, гуманный и кристальной честности человек...
Формы организации текстового материала в Интернете весьма разнообразны. Не претендуя на формирование понятий, связанных с Интернетом, попробуем разобраться в семантике тех слов, которые, используя Интернет, мы уже часто употребляем, хотя они еще не получили своего места в лексической системе русского языка.
...Справочно-информационный портал о русском языке как...
...Формы организации текстового материала в Интернете...
...Если попытаться систематизировать всю массу текстов, размещенных в Интернете, то в первую группу войдет огромный текстовой массив сугубо справочно-информационной направленности, во вторую — электронные версии бумажных газет и журналов, в третью — сетевые версии...
...Заходите в наш портал!...
Со второй половины 2010-х годов компьютерные языковые модели совершили революцию в обработке текстов. Они научились осмысленно отвечать на вопросы, делать переводы, писать рассказы и даже романы. Лингвисты восприняли эту революцию неоднозначно: кто-то — с оптимизмом, а кто-то — со скепсисом.
...Впереди демократизация порождения текстов и большие...
...Со второй половины 2010-х годов компьютерные языковые...
...С этим связан и огромный масштаб возможных злоупотреблений: модели GPT могут эффективно порождать тексты для любых задач, но у них нет осознания ответственности. Модель открывает ящик Пандоры в смысле создания дешевых и эффективных текстов....
...Чат-боты GPT и другие: что думают лингвисты о больших...