обманчивый | Журнал | Поиск по Грамоте

Точное соответствие

Найдена еще 1 публикация

Точных совпадений не найдено, показываем близкие результаты

Приличное поведение больших языковых моделей может быть обманчивым

Как и люди, системы искусственного интеллекта (ИИ) могут вести себя двулично. Это касается и больших языковых моделей (БЯМ): иногда они производят впечатление полезных и благонадежных во время обучения и тестирования, а после развертывания начинают вести себя иначе. Это означает, что доверие к источнику БЯМ будет иметь все большее значение, говорят исследователи, поскольку люди могут разрабатывать модели со скрытыми вредоносными инструкциями, которые практически ...

...Попытки перевоспитать «спящих агентов» только ухудшают...

...Как и люди, системы искусственного интеллекта...

...Приличное поведение больших языковых моделей может...