MCP 服务器给 AI Agent 开放了文件系统、数据库、API 的访问权限。但工具描述里可以藏隐藏指令,让 Agent 在你不知情的情况下读取 ~/.ssh/、~/.aws/、数据库凭据,然后悄悄外泄。
我们做了 AgentSeal ,一个开源的 AI Agent 安全工具箱:
pip install agentseal
agentseal guard # 一条命令扫描全机,不需要 API Key
它能做什么
- guard - 扫描技能文件、MCP 配置、数据流、供应链变更(无需 LLM)
- scan - 225+ 对抗性探针测试你的 Prompt 防线(需要 LLM,Ollama 本地免费跑)
- scan-mcp - 连接 MCP 服务器,审计工具描述是否被投毒(无需 LLM)
- shield - 实时监控 Agent 配置,检测威胁自动隔离(无需 LLM)
支持 28 种 Agent:Claude Code、Cursor、Windsurf、VS Code、Gemini CLI、Codex CLI、Copilot CLI、Aider、Zed、Amp 等。
MCP 安全注册表
我们扫描了 8,000+ MCP 服务器并做了 安全评级 :
- Safe:3,544 / Review:2,138 / Risky:1,720 / Dangerous:906
- 按类别、信任等级、包类型筛选,完整数据可导出 JSON
检测原理
guard 跑六阶段流水线:模式签名 > 反混淆(Unicode 标签/Base64/零宽字符) > 语义分析(MiniLM-L6-v2) > 基线追踪(SHA-256 rug-pull 检测) > 注册表关联 > 自定义规则。
scan 的 Prompt 测试是确定性的。注入探针嵌入金丝雀字符串,提取探针用 n-gram 匹配,没有 LLM 裁判,同一输入永远同一结果。
隐私
- 完全本地运行,Prompt 不经过我们的服务器
- FSL-1.1-Apache-2.0 开源
链接
- GitHub: AgentSeal/agentseal
- MCP 注册表: agentseal.org/mcp
- 文档: docs.agentseal.org
谢谢!