你的 AI Agent 正在被投毒,你可能还不知道

MCP 服务器给 AI Agent 开放了文件系统、数据库、API 的访问权限。但工具描述里可以藏隐藏指令,让 Agent 在你不知情的情况下读取 ~/.ssh/、~/.aws/、数据库凭据,然后悄悄外泄。

我们做了 AgentSeal ,一个开源的 AI Agent 安全工具箱:

pip install agentseal
agentseal guard # 一条命令扫描全机,不需要 API Key

它能做什么

  • guard - 扫描技能文件、MCP 配置、数据流、供应链变更(无需 LLM)
  • scan - 225+ 对抗性探针测试你的 Prompt 防线(需要 LLM,Ollama 本地免费跑)
  • scan-mcp - 连接 MCP 服务器,审计工具描述是否被投毒(无需 LLM)
  • shield - 实时监控 Agent 配置,检测威胁自动隔离(无需 LLM)

支持 28 种 Agent:Claude Code、Cursor、Windsurf、VS Code、Gemini CLI、Codex CLI、Copilot CLI、Aider、Zed、Amp 等。

MCP 安全注册表

我们扫描了 8,000+ MCP 服务器并做了 安全评级

  • Safe:3,544 / Review:2,138 / Risky:1,720 / Dangerous:906
  • 按类别、信任等级、包类型筛选,完整数据可导出 JSON

检测原理

guard 跑六阶段流水线:模式签名 > 反混淆(Unicode 标签/Base64/零宽字符) > 语义分析(MiniLM-L6-v2) > 基线追踪(SHA-256 rug-pull 检测) > 注册表关联 > 自定义规则。

scan 的 Prompt 测试是确定性的。注入探针嵌入金丝雀字符串,提取探针用 n-gram 匹配,没有 LLM 裁判,同一输入永远同一结果。

隐私

  • 完全本地运行,Prompt 不经过我们的服务器
  • FSL-1.1-Apache-2.0 开源

链接

谢谢!

1 个赞