集成
Hermes Agent 可以连接多种外部系统,用于 AI 推理、工具服务器、IDE 工作流和程序化访问等场景。这些集成共同扩展了 Hermes 的能力边界和实际运行方式。
AI 提供商与路由
Hermes 原生支持多种 AI 推理提供商。你既可以通过 hermes model 交互式配置,也可以直接在 config.yaml 中手动设置。
- AI 提供商 — 支持 OpenRouter、Anthropic、OpenAI、Google 以及任意兼容 OpenAI 的端点。Hermes 还会自动识别不同提供商的能力,例如视觉理解、流式输出和工具调用支持。
- 提供商路由 — 对 OpenRouter 背后的底层提供商进行细粒度控制,通过排序、白名单、黑名单和显式优先级优化成本、速度或质量。
- 备用提供商 — 当主模型出错时,自动切换到备用 LLM 提供商。除了主模型回退,也支持视觉、压缩、网页提取等辅助任务的独立回退。
工具服务器(MCP)
- MCP 服务器 — 通过 Model Context Protocol(MCP)连接外部工具服务器。无需编写原生 Hermes 工具,也能访问 GitHub、数据库、文件系统、浏览器栈和内部 API 等资源。支持
stdio与SSE两种传输方式,还可以按服务器粒度过滤工具,并基于能力自动注册资源与提示。
网络搜索后端
web_search 和 web_extract 工具支持四种后端,可通过 config.yaml 或 hermes tools 进行配置:
| 后端 | 环境变量 | 搜索 | 提取 | 爬取 |
|---|---|---|---|---|
| Firecrawl(默认) | FIRECRAWL_API_KEY | ✔ | ✔ | ✔ |
| Parallel | PARALLEL_API_KEY | ✔ | ✔ | — |
| Tavily | TAVILY_API_KEY | ✔ | ✔ | ✔ |
| Exa | EXA_API_KEY | ✔ | ✔ | — |
快速配置示例:
web:
backend: firecrawl # firecrawl | parallel | tavily | exa
如果未设置 web.backend,系统会根据当前可用的 API 密钥自动选择后端。你也可以通过 FIRECRAWL_API_URL 接入自托管的 Firecrawl。
浏览器自动化
Hermes 内置了完整的浏览器自动化能力,并提供多种后端以支持网页导航、表单填写和信息提取:
- Browserbase — 受管理的云浏览器,具备反机器人防护、验证码识别和住宅代理功能
- Browser Use — 另一种云浏览器服务
- 本地 Chrome(CDP 协议) — 使用
/browser connect连接本地正在运行的 Chrome 实例 - 本地 Chromium — 通过
agent-browserCLI 启动无头本地浏览器
详见 浏览器自动化 获取配置与使用说明。
语音与 TTS 提供商
跨所有消息平台的文本转语音(TTS)与语音转文字(STT)支持:
| 提供商 | 质量 | 成本 | API 密钥 |
|---|---|---|---|
| Edge TTS(默认) | 良好 | 免费 | 无需 |
| ElevenLabs | 优秀 | 付费 | ELEVENLABS_API_KEY |
| OpenAI TTS | 良好 | 付费 | VOICE_TOOLS_OPENAI_KEY |
| MiniMax | 良好 | 付费 | MINIMAX_API_KEY |
| NeuTTS | 良好 | 免费 | 无需 |
语音转文字目前支持三个提供商:本地 Whisper(免费、设备端运行)、Groq(速度快的云端方案)和 OpenAI Whisper API。语音消息转录适用于 Telegram、Discord、WhatsApp 等多个消息平台。详情请参阅 语音与 TTS 和 语音模式。
IDE 与编辑器集成
- IDE 集成(ACP) — 在支持 ACP 的编辑器(如 VS Code、Zed、JetBrains 系列)中使用 Hermes Agent。Hermes 会作为 ACP 服务器运行,在编辑器中呈现聊天消息、工具活动、文件差异和终端命令。
程序化访问
- API 服务器 — 将 Hermes 暴露为兼容 OpenAI 的 HTTP 接口。任何支持 OpenAI 格式的前端(如 Open WebUI、LobeChat、LibreChat、NextChat、ChatBox)都可以接入,并把 Hermes 当作后端使用,直接获得它的完整工具能力。
记忆与个性化
- 内置记忆 — 通过
MEMORY.md和USER.md文件实现持久化、可选择的记忆存储。Agent 会在会话之间保留有限的个人笔记和用户资料。 - 记忆提供商 — 接入外部记忆后端以实现更深入的个性化能力。支持七种记忆服务:Honcho(辩证推理)、OpenViking(分层检索)、Mem0(云端提取)、Hindsight(知识图谱)、Holographic(本地 SQLite)、RetainDB(混合搜索)、ByteRover(CLI 风格操作)。
消息平台
Hermes 作为网关机器人运行于 15+ 消息平台,全部通过统一的 gateway 子系统进行配置:
- Telegram、Discord、Slack、WhatsApp、Signal、Matrix、Mattermost、邮件、短信、钉钉、飞书/Lark、企业微信、企业微信回调、微信、BlueBubbles、QQ Bot、Home Assistant、Webhooks
详见 消息网关概览 获取平台对比表和配置指南。
家庭自动化
- Home Assistant — 通过四个专用工具(
ha_list_entities、ha_get_state、ha_list_services、ha_call_service)控制智能家居设备。配置好HASS_TOKEN后,Home Assistant 工具集会自动启用。
插件系统
- 插件系统 — 无需修改核心代码,即可通过自定义工具、生命周期钩子和 CLI 命令扩展 Hermes。插件可从
~/.hermes/plugins/、项目本地的.hermes/plugins/以及 pip 安装的入口点中发现。 - 构建插件 — 逐步讲解如何创建带有工具、钩子和 CLI 命令的 Hermes 插件。