Skip to main content

集成

Hermes Agent 可连接外部系统,实现 AI 推理、工具服务器、IDE 工作流、程序化访问等功能。这些集成扩展了 Hermes 的能力边界,使其可在更多场景中运行。

AI 服务提供商与路由

Hermes 原生支持多个 AI 推理服务提供商。可通过 hermes model 交互式配置,或在 config.yaml 中进行设置。

  • AI 服务提供商 — 支持 OpenRouter、Anthropic、OpenAI、Google 以及任何兼容 OpenAI 接口的端点。Hermes 能自动检测各服务商的能力,如视觉理解、流式输出和工具调用。
  • 服务提供商路由 — 对 OpenRouter 请求的底层服务提供商进行细粒度控制。通过排序、白名单、黑名单及显式优先级设置,可优化成本、速度或质量。
  • 备用服务提供商 — 当主模型出现错误时,自动切换至备用 LLM 服务。支持主模型降级回退,以及独立的辅助任务回退(适用于视觉处理、压缩和网页提取)。

工具服务器(MCP)

  • MCP 服务器 — 通过 Model Context Protocol (MCP) 连接外部工具服务器。无需编写原生 Hermes 工具即可访问 GitHub、数据库、文件系统、浏览器栈、内部 API 等资源。支持 stdio 和 SSE 两种传输方式,每台服务器可配置工具过滤规则,并基于能力进行资源与提示注册。

网络搜索后端

web_searchweb_extract 工具支持四种后端服务提供商,可通过 config.yamlhermes tools 配置:

后端环境变量搜索提取爬取
Firecrawl(默认)FIRECRAWL_API_KEY
ParallelPARALLEL_API_KEY
TavilyTAVILY_API_KEY
ExaEXA_API_KEY

快速配置示例:

web:
backend: firecrawl # firecrawl | parallel | tavily | exa

若未设置 web.backend,系统将根据可用的 API 密钥自动检测后端。也支持通过 FIRECRAWL_API_URL 自托管 Firecrawl。

浏览器自动化

Hermes 内置完整的浏览器自动化功能,提供多种后端选项,用于网站导航、表单填写和信息提取:

  • Browserbase — 受管理的云浏览器,具备反机器人防护、验证码破解和住宅代理功能
  • Browser Use — 替代性云浏览器服务提供商
  • 本地 Chrome(通过 CDP) — 使用 /browser connect 连接到正在运行的 Chrome 实例
  • 本地 Chromium — 通过 agent-browser CLI 启动无头本地浏览器

详见 浏览器自动化 获取配置与使用说明。

语音与 TTS 服务提供商

跨所有消息平台的文本转语音(TTS)与语音转文字(STT)支持:

服务提供商质量成本API 密钥
Edge TTS(默认)良好免费无需
ElevenLabs优秀付费ELEVENLABS_API_KEY
OpenAI TTS良好付费VOICE_TOOLS_OPENAI_KEY
MiniMax良好付费MINIMAX_API_KEY
NeuTTS良好免费无需

语音转文字支持三个提供商:本地 Whisper(免费,设备端运行)、Groq(快速云端)、OpenAI Whisper API。语音消息转录功能支持 Telegram、Discord、WhatsApp 等多种消息平台。详情请参见 语音与 TTS语音模式

IDE 与编辑器集成

  • IDE 集成(ACP) — 在支持 ACP 的编辑器(如 VS Code、Zed、JetBrains 系列)中使用 Hermes Agent。Hermes 作为 ACP 服务器运行,在编辑器内渲染聊天消息、工具活动、文件差异和终端命令。

程序化访问

  • API 服务器 — 将 Hermes 暴露为兼容 OpenAI 的 HTTP 接口。任何支持 OpenAI 格式的前端(如 Open WebUI、LobeChat、LibreChat、NextChat、ChatBox)均可连接并使用 Hermes 的完整工具集作为后端。

记忆与个性化

  • 内置记忆 — 通过 MEMORY.mdUSER.md 文件实现持久化、有选择性的记忆。该机制可在会话间保留个人笔记和用户资料。
  • 记忆服务提供商 — 插入外部记忆后端以实现更深层次的个性化。共支持七种方案:Honcho(辩证推理)、OpenViking(分层检索)、Mem0(云端提取)、Hindsight(知识图谱)、Holographic(本地 SQLite)、RetainDB(混合搜索)、ByteRover(CLI 驱动)。

消息平台

Hermes 作为网关机器人运行于 15+ 消息平台,所有配置均通过统一的 gateway 子系统完成:

详见 消息网关概览 获取平台对比表与配置指南。

家庭自动化

  • Home Assistant — 通过四个专用工具(ha_list_entities, ha_get_state, ha_list_services, ha_call_service)控制智能家居设备。当配置 HASS_TOKEN 后,Home Assistant 工具集将自动激活。

插件系统

  • 插件系统 — 无需修改核心代码即可通过自定义工具、生命周期钩子和 CLI 命令扩展 Hermes 功能。插件可从 ~/.hermes/plugins/、项目本地的 .hermes/plugins/ 以及 pip 安装的入口点中发现。
  • 构建插件 — 逐步指南,教你如何创建包含工具、钩子和 CLI 命令的 Hermes 插件。

训练与评估

  • 强化学习训练 — 从代理会话中生成轨迹数据,用于强化学习与模型微调。支持 Atropos 环境,并可自定义奖励函数。
  • 批量处理 — 并行运行数百个提示,生成结构化的 ShareGPT 格式轨迹数据,用于训练数据生成或评估。