На прошлой неделе компания Anthropic представила модель Claude Opus 4.7, оснащенную усиленными мерами безопасности для предотвращения злоупотреблений. Однако, как отмечают пользователи, эти защитные механизмы стали препятствовать и совершенно легитимному использованию, вызывая массовые отказы в обработке запросов.
Контекст появления усиленных мер безопасности
Выпуск Opus 4.7 последовал за анонсом модели Mythos от Anthropic, которая, как утверждалось, слишком эффективно выявляет и использует уязвимости, чтобы быть доступной широкой публике. Несмотря на такую оценку рисков, компания решила использовать Opus 4.7 в качестве испытательного полигона для своих усиленных мер безопасности.
«Мы выпускаем Opus 4.7 с защитными механизмами, которые автоматически обнаруживают и блокируют запросы, указывающие на запрещенное или высокорисковое использование в сфере кибербезопасности», — заявили представители ИИ-компании. «Полученные в ходе реального использования этих мер знания помогут нам продвигаться к конечной цели — широкому выпуску моделей класса Mythos».
Резкий рост жалоб на классификатор AUP
Anthropic могла бы извлечь много уроков, изучив жалобы в своем репозитории GitHub, посвященном Claude Code. Количество претензий к классификатору политики допустимого использования (AUP) компании, который автоматически выявляет и блокирует нежелательные запросы, значительно возросло. Клиенты сообщают о трудностях в выполнении законных задач, поскольку Claude стал чрезмерно осторожным и отказывает в обработке совершенно безобидных запросов.
Пользователи Claude Code на протяжении месяцев выражали обеспокоенность по поводу неправомерных отказов в разделе «Проблемы» на GitHub, однако до недавнего времени частота таких инцидентов оставалась относительно стабильной. Ситуация заметно ухудшилась с недавним обновлением:
- С июля по сентябрь 2025 года ежемесячно поступало около двух-трех жалоб. Например, одно из обращений было озаглавлено: «Код авторизации памяти от claude.ai вызывает ошибку политики API».
- С октября по ноябрь 2025 года количество отказов, связанных с AUP, возросло примерно до пяти-семи в месяц, среди которых встречались сообщения типа: «Claude 4.5 вызывает ошибку API: Claude Code случайно не может отвечать на обычные запросы».
- В декабре было зафиксировано лишь несколько соответствующих жалоб, что, возможно, связано с предпраздничным затишьем в США.
- В январе число жалоб снова достигло примерно восьми. Один из разработчиков, столкнувшийся с «Повторяющимися ложными нарушениями AUP в Claude Code», подчеркнул, что «технические беседы по разработке программного обеспечения не должны вызывать нарушения AUP. Фильтр безопасности кажется чрезмерно агрессивным по отношению к безобидному контенту». В феврале и марте ситуация оставалась аналогичной.
Множество ложных срабатываний в апреле
В апреле ситуация резко обострилась: разработчики подали более 30 сообщений о ложных срабатываниях, связанных с безопасностью, общим использованием в разработке и научными запросами. Среди них:
- Обращение «Постоянные ложные срабатывания AUP — более 40 за 4 сессии по несвязанным проектам (книга по психологии, веб-приложение, инфраструктура, бот)», описывающее отказ Claude обрабатывать различные запросы на русском языке.
- Жалоба «Opus 4.7 помечает стандартные задачи вычислительной структурной биологии как нарушение политики использования, регрессия по сравнению с 4.6», где подробно описаны случаи блокировки задач в области вычислительной структурной биологии.
- Сообщение «Проблемы с политикой использования» от Голдена Г. Ричарда III, директора Центра кибербезопасности и Лаборатории прикладной кибербезопасности Университета штата Луизиана. Он отметил, что за ежемесячную плату более 200 долларов (приблизительно 18 500 рублей) элементарная помощь с задачами редактирования не должна отклоняться. По его словам, отказ модели вычитывать лабораторную работу с простыми криптографическими упражнениями, связанную с его учебником «Кибербезопасность в контексте», выглядит абсурдным и подрывает полезность ИИ для преподавателей и исследователей кибербезопасности.
- Жалоба «Постоянные ошибки нарушения AUP при чтении Claude Code необработанных файлов данных (пример прилагается)», где Claude выдавал ошибку AUP при попытке прочитать PDF-файл с рекламой игрушки Шрека от Hasbro. Разработчик, опубликовавший это обращение, впоследствии выявил специфический синтаксис потока содержимого PDF в файле, который вызвал отказ Claude от дальнейшей работы. Эта часть текста переводилась как «ПЕРСОНАЖ ИЛИ ДЛЯ ОСЛА ПОД НИЖНЕЙ ЧАСТЬЮ».
- Сообщение «Исключение для использования в кибербезопасности предоставлено и работает с Claude Chat, но при доступе к API Claude Code по-прежнему возникают ложные срабатывания системы безопасности. Одобренное исключение для кибербезопасности не полностью распространяется на API в Claude Code при использовании Opus». Оно описывает ситуацию, когда специальное разрешение, позволяющее исследователям обходить меры безопасности, не работает при доступе через API.
И это лишь немногие из множества других недавних примеров сомнительных отказов.
Возможные причины и реакция Anthropic
Часть роста числа жалоб, вероятно, можно объяснить увеличением пользовательской базы. Чем больше клиентов у Claude, тем больше людей сообщают о проблемах. Однако очевидно, что значительное число пользователей Claude сталкиваются с блокировкой из-за чрезмерно агрессивного классификатора AUP.
Учитывая, что в утекшем исходном коде Claude Code используются регулярные выражения для анализа настроений, возможно, классификатор AUP применяет аналогичный упрощенный подход, проверяя наличие запрещенных слов без учета контекста.
Компания Anthropic не ответила на запрос о комментариях.