Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Михаил Копотев о роли сгенерированных нейросетью текстов...
...Нейросети учатся на текстах, созданных человеком. Но...
... По мере их поступления можно дообучать языковую модель — с учетом этого она будет становиться лучше и научится искать ошибки у китайских, немецких, русских и всех остальных учеников....
...Обучение и самообучение: как синтетические данные влияют...
Соглашаясь с необходимостью законодательного регулирования вопросов, связанных с государственным языком, лингвисты обращают внимание на необходимость уточнения положений закона о государственном языке РФ. Некоторые из них называют отправленный на доработку закон антинаучным, дилетантским и антижурналистским, другие принципиально выступают против законодательного регулирования словоупотребления.
...Мнения лингвистов по поводу закона о государственном...
...Соглашаясь с необходимостью законодательного регулирования...
...Нам надо только «помочь» ему в этом, «помочь», а не становиться в позицию «защиты». Вопрос, может ли безобразное быть неотъемлемой частью эстетического замысла (см. конец части 1 статьи 3), конечно, непрост....
...Притча во языцех...
Цифровые технологии сегодня позволяют превратить любое собрание сочинений в настоящую базу данных, чтобы увидеть многочисленные связи внутри текста и между текстами, выявить необычные закономерности.
...Как цифровые технологии расширяют возможности изучения...
...Цифровые технологии сегодня позволяют превратить любое...
... Семантические издания полезны как для профессионалов, так и для всех, кто интересуется русской литературой, поэтому таких проектов будет становиться все больше. Например, обсуждаются перспективы объединения усилий для создания цифрового Достоевского....
...Семантические издания Толстого, Пушкина и Чехова —...