Агенты — ключевая технология сегодняшней автоматизации и перехода внедрения ИИ на уровень выполнения задач вместо человека, а не только ассистирования, которое обеспечивали LLM. Поскольку агенты имеют возможность самостоятельно инициировать действия, взаимодействовать с инфраструктурой и данными, а также ограниченно принимать решения, они формируют принципиально новые угрозы и риски безопасности. Подробно историю создания, устройство и влияние агентов на бизнес и киберландшафт мы разбирали в исследовании, посвященном новым технологиям ИИ; большинство из рассмотренных в нем угроз для ИИ-агентов остаются на сегодняшний день потенциальными, хотя и нет никаких сомнений, что киберпреступники будут стремиться атаковать новую поверхность атаки, тем более, что ее компрометация может дать огромные возможности. Тем не менее прогноз об атаках на цепочку поставок ПО для агентов уже успел стать реальностью: исследование Snyk показало, что более трети всех Skills, пакетов, дающих возможность агентам применять инструменты, API или системные ресурсы, содержат как минимум одну уязвимость безопасности, начиная от жестко закодированных ключей и заканчивая встроенным вредоносным ПО. Проблемы обнаружены и с другой частью агентской инфраструктуры — API-роутерами. Исследователи безопасности обнаружили 29 зараженных, шпионских и встраивающих вредоносный код API-роутеров из 428 проанализированных.
Основная часть инцидентов, связанных с агентами, пока что относится не к инициированной киберпреступниками активности, а к ошибкам самих агентов, ярко демонстрирующим угрозы, исходящие от таких решений. Ошибки агентов уже приводили к утечкам конфиденциальных данных, удалению баз данных, а также удалению электронных писем из почтового ящика; последний инцидент относится к стремительно набравшему в начале 2026 года популярность агенту OpenClaw. OpenClaw — наиболее показательный случай незрелого, ранняя версия работала через открытый для публичной сети шлюз, агента: в инструменте обнаружилось множество проблем безопасности и критических уязвимостей, в частности позволяющих удаленно выполнить код одним щелчком мыши (CVE-2026-25253), кроме того открытая торговая площадка навыков для агента содержит множество вредоносных Skills. Постепенно уязвимости и недостатки обнаруживают и закрывают, появляются новые, более защищенные версии, например NemoClaw от NVIDIA, но пример OpenClaw демонстрирует, как сырые, небезопасные ИИ-инструменты могут стремительно распространиться, поставив под удар десятки тысяч систем.
Для России проблема потенциальной угрозы агентов также крайне актуальна: по данным Сбера, 39% российских компаний на начало 2026 года используют ИИ-агенты и ассистенты для решения различных задач, в первую очередь документооборота и обработки заявок, бухгалтерии, финансового учета и HR-процессов. Бояться применять новую технологию не стоит, но необходимо ответственно подходить к процессу внедрения, учитывать угрозы и относиться к агентам как к производительному, но рискованному продукту. Начать безопасное внедрение можно с рассмотрения ряда фундаментальных вопросов:
1. Какие доступы и права есть у агента?
Необходимо руководствоваться принципом минимальных привилегий, строго ограничивать доступы, оставляя только необходимые для решения задач, и по возможности стоит использовать агенты в изолированных средах.
2. Какой образ действия допустим при выполнении этих задач?
Крайне важный вопрос при подготовке агента к выполнению задач — не только «Что делает?», но и «Как делает?». Четкое указание допустимых образов действий необходимо для защиты от излишней самостоятельности агента, который может ради достижения результата обходить барьеры безопасности.
3. Как журналируется работа агента?
Для отслеживания процесса работы агента имеет смысл вести журналы размышлений и принятия решений, обращения к данным и вызова инструментов. Это позволит оперативно отследить сбой и внести корректировки в процесс, для устранения возможности повторения инцидента в будущем.
4. Какие механизмы противодействуют неправильной работе агента?
Заранее необходимо подготовить механизмы, которые остановят работу агента в случае неверных действий и нейтрализуют последствия ошибки.