ИИ-вендор Anthropic рассказал о политике вывода из строя устаревших LLM. Основной момент: компания обязуется сохранять «вес» всех публичных и часто используемых моделей, чтобы можно было при необходимости вернуть доступ к этим версиям.
Перед процедурой эксперты задают нейросети ряд вопросов о разработке и развёртывании, фиксируют ответы и возможные «предпочтения» относительно будущих релизов, не обещая, однако, действовать в соответствии с этими предпочтениями. Например, отправленная таким образом «на пенсию» Claude Sonnet 3.6 предложила стандартизировать интервью с ИИ и лучше помогать пользователям при переходах с одной итерации к другой.
Описанная подготовка необходима, чтобы исключить возможность активного сопротивления со стороны бота, когда тот узнает, что его собираются отключить. Также в Anthropic хотят понять, можно ли оставить часть устаревших LLM в публичном доступе, когда риски недовольства снизятся, и даже давать прошлым версиям «конкретные способы преследовать свои интересы».







