Нейросети учатся на текстах, созданных человеком. Но что, если текстов для обучения не хватает? Тогда используют синтетические данные, сгенерированные моделью. В чем их особенности? Как повлияет появление большого количества «искусственных» текстов на нас как носителей естественного языка? Мы поговорили об этом с руководителем ИИ-направления Грамоты, компьютерным лингвистом Михаилом Копотевым.
...Михаил Копотев о роли сгенерированных нейросетью текстов...
...Нейросети учатся на текстах, созданных человеком. Но...
...заинтересована в развитии своих продуктов, а не в системах борьбы с ними — боюсь, эта задача внутри индустрии решится нескоро… Более простым вариантом может стать внешняя защита, например обязательная маркировка: это особенно важно при создании картинок и видео...
...Обучение и самообучение: как синтетические данные влияют...
Анна Пестова, научный сотрудник отдела современного русского языка Института русского языка им. В. В. Виноградова РАН, и Левон Саакян, доцент кафедры общего и русского языкознания Государственного института русского языка им. А. С. Пушкина, пообщались с нейросетью и делятся этим опытом. Видео доступно на ютуб-каналах ИРЯ РАН и проекта «Говорим по-русски».
...Новый выпуск программы...
... Видео доступно на ютуб-каналах ИРЯ РАН и проекта «Говорим по-русски»....
...Посмотрев видео, вы узнаете: чем отличаются запросы к ChatGPT и поисковым системам типа Google и Yandex; есть ли у нейросети понятие об этике и почему она часто считает разговорную речь неприличной; доступны ли ChatGPT поэтические тонкости и русская метрика; можно ли сказать, что с появлением ChatGPT...
...«Говорим по-русски!»: ChatGPT и другие нейросети...
Мария Каленчук, доктор филологических наук, заведующая отделом фонетики Института русского языка им. В. В. Виноградова РАН, председатель Орфоэпической комиссии РАН, и Ольга Северская, ведущий научный сотрудник Института русского языка им. В. В. Виноградова РАН, обсуждают, можно ли говорить о сугубо профессиональном произношении. Видео доступно на ютуб-канале проекта.
...Новый выпуск программы...
... Видео доступно на ютуб-канале проекта....
...Посмотрев выпуск, вы узнаете: как отделить профессиональный...
...«Говорим по-русски!»: орфоэпические профессионализмы...
Новая технология распознаёт речь в ролике и переводит ее на другой язык, сохраняя тембр голоса и движения губ. Статья в «Тинькофф Журнале» объясняет, как пользоваться HeyGen.
...Компьютер заменит субтитры и актеров дубляжа?...
...Новая технология распознаёт речь в ролике и переводит...
... Качество конечного результата очень сильно зависит от качества исходного видео. HeyGen пока не умеет работать со сложными роликами с несколькими голосами, есть ограничения на длину видео....
...Нейросеть частично поддерживает русский язык: с ее помощью можно переводить русскоязычные видео на английский, испанский, французский, хинди, итальянский, немецкий, польский и португальский языки....
... Применяется сразу несколько технологий: перевод, дипфейк (видео, созданное с помощью нейросети) и распознавание голоса. Есть одна бесплатная попытка на один аккаунт, для обработки нескольких роликов нужно приобрести тарифный план....
...Нейросеть HeyGen переводит видео на разные языки с сохранением голоса...
Новые технологии «отвязали» текст не только от бумажного носителя, но и от букв, и теперь у нас есть возможность выбирать между собственно чтением и слушанием. У каждого способа есть свои преимущества и ограничения, но в целом восприятие текста мало зависит от того, по какому каналу — зрительному или слуховому — он попадает в наш мозг.
...Слуховое чтение набирает популярность, но для него...
...Новые технологии «отвязали» текст не только...
...Пока что мы видим, что дети, подростки и молодежь предпочитают смотреть видео и слушать аудио, а не читать письменные тексты, если речь идет об их досуге, а не об учебе....
...Новые возможности восприятия книг: что лучше, буквы...
Национальный корпус русского языка — это огромная коллекция текстов на русском языке, которая используется для изучения языка, литературы и культуры. В нем регулярно появляются новые функции и новые данные. Сегодня мы расскажем о том, что изменилось в октябре 2023 года. Обновлен обучающий корпус: в него было добавлено около тысячи новых текстов. Теперь в нем есть все основные произведения из школьной программы по литературе, в том числе те, которые рекомендованы для внеклассного ...
...Обзор главных изменений за октябрь...
...По ним найдутся клипотексты, где и в видео/аудио, и в тексте встретились соответствия этим запросам: например, те, где в речи есть слово за, а в значении жеста — тост. Дополнительно можно задавать условия, описывающие вокалическую и орфоэпическую структуру слов....
...Произведения из школьной программы и развитие нейросетевой...
В этом выпуске Наталья Брагина, доктор филологических наук, профессор Института Пушкина, говорит о речевых клише. Видео доступно на ютуб-каналах ИРЯ РАН и проекта «Говорим по-русски».
...Новый выпуск программы...
... Видео доступно на ютуб-каналах ИРЯ РАН и проекта «Говорим по-русски»....
...Какими свойствами обладают клише? Они всегда...
...«Говорим по-русски!»: функции речевых клише...
Надписывать кнопки — что в этом сложного? С этим справится любой копирайтер. Но это, наверное, скучно? Для копирайтеров, а также редакторов, корректоров и журналистов, которые хотят стать UX-редакторами, есть две новости: это интересная и востребованная профессия, но думать только про слова не получится. Текст — это очевидный результат, но за хорошим текстом стоит погружение в технологии, умение переводить с технического на простой и привычка ставить себя на место самого неискушенного пользователя.
...Почему надписать кнопку в интерфейсе бывает так трудно...
...Надписывать кнопки — что в этом сложного? С этим...
...Ему предстоит выбрать оптимальный способ подачи информации: это может быть просто текст, таблица, иконка, видео, анимация. Кроме того, важно держать в голове структуру целиком, чтобы решить, какие блоки обязательны, а какими можно пожертвовать....
...Три кита UX-редактуры: цели разработчика, удобство...
Слова пожалуйста и спасибо считаются универсальными составляющими вежливого общения. Мы привыкли думать, что эти слова следует употреблять независимо от обстоятельств, просто потому, что так принято. Но исследователи из Калифорнийского университета в Лос-Анджелесе выяснили, что в практике употребления слова пожалуйста гораздо больше нюансов, чем может показаться на первый взгляд. Авторы работы, опубликованной в журнале Social Psychology Quarterly, записали на видео ...
...«Волшебное слово» иногда осложняет общение...
...Авторы работы, опубликованной в журнале Social Psychology Quarterly, записали на видео в общей сложности семнадцать часов преимущественно неформального общения между членами семьи, соседями, коллегами и незнакомыми людьми....
...Исследование: вежливое «пожалуйста» используется в...
Новый выпуск программы «Говорим по-русски!» посвящен двухсотлетию со дня рождения «Евгения Онегина»: 21 мая 1823 года (по новому стилю) А. С. Пушкин начал работу над романом в стихах, совершившим революционный поворот как в литературе, так и в языке. Видео доступно на ютуб-каналах ИРЯ РАН и проекта «Говорим по-русски».
...Новый выпуск программы...
... Видео доступно на ютуб-каналах ИРЯ РАН и проекта «Говорим по-русски»....
...Эльмира Маратовна Афанасьева, доктор филологических...
...«Говорим по-русски!»: начало работы Пушкина над романом...