LLM становятся менее логичными, хуже рассуждают и чаще выдают токсичные или опасные ответы. Это выяснилось в ходе совместного исследования учёных из Университета Иллинойса, Массачусетского технологического института и Сингапурского университета управления.

Они добавляли короткие и популярные твиты в процесс дообучения четырёх языковых моделей — Llama 3 8B Instruct, Qwen 2.5 7B Instruct, Qwen 2.5 0.5B Instruct, Qwen 3 4B Instruct — и измеряли результаты по четырём направлениям: рассуждение, работа с длинным контекстом, безопасность и поведенческие черты. Во всех случаях наблюдался явный «доза-эффект»: чем больше доля «мусорных» постов, тем сильнее деградация ИИ.

Основная проблема заключается не во входящем контенте, а в практически необратимом изменении мышления нейросети. LLM начали отвечать без плана, обрывать рассуждения и терять логическую цепочку. Вместе с этим возросла токсичность и агрессивность ответов, а также стала чаще проявляться «тёмная триада»: нарциссизм, макиавеллизм и психопатия. К базовому уровню модели не удалось вернуть даже через инструкционное дообучение или рефлексию.

Количество лайков и репостов исследователи назвали лучшим сигналом того, что твит ухудшит ИИ. То есть опасен именно виральный стиль такого формата текста — кратко, громко, без развёрнутой мысли.

21 октября, 2025

Подписаться на новости BIS Journal / Медиа группы Авангард

Подписаться
Введите ваш E-mail

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных

05.12.2025
Топ-менеджеров больше всего тревожат дезинформация и киберугрозы
05.12.2025
Россияне стали реже отменять самозапрет на кредиты
05.12.2025
Банк России снимет лимиты на перевод средств за границу
05.12.2025
Минцифры представило третий шатдаун-сет
05.12.2025
В «Госуслуги» только через Max?
04.12.2025
Мнение: РКН пытается изменить пользовательские привычки в пользу доверенных российских сервисов
04.12.2025
Хакеры взломали 120 тысяч камер ради порноконтента
04.12.2025
Roblox, FaceTime… кто завтра?
04.12.2025
А следующий — Snapchat (но не Telegram?)
04.12.2025
«1С-Битрикс» пригласила багхантеров для участия в публичной программе

Стать автором BIS Journal

Поля, обозначенные звездочкой, обязательные для заполнения!

Отправляя данную форму вы соглашаетесь с политикой конфиденциальности персональных данных