Hermes 在安装时会将一个大型内置技能库复制到 ~/.hermes/skills/。本页列出了位于仓库中 skills/ 路径下的所有内置技能。
apple
苹果/macOS 特定技能 —— iMessage、提醒事项、备忘录、查找我的设备,以及 macOS 自动化功能。这些技能仅在 macOS 系统上加载。
| 技能 | 描述 | 路径 |
|---|
apple-notes | 通过 macOS 上的 memo CLI 管理 Apple 备忘录(创建、查看、搜索、编辑)。 | apple/apple-notes |
apple-reminders | 通过 remindctl CLI 管理 Apple 提醒事项(列出、添加、完成、删除)。 | apple/apple-reminders |
findmy | 使用 AppleScript 和屏幕截图,通过 FindMy.app 在 macOS 上追踪 Apple 设备和 AirTag。 | apple/findmy |
imessage | 通过 macOS 上的 imsg CLI 发送和接收 iMessage/SMS。 | apple/imessage |
autonomous-ai-agents
用于启动和协调自主 AI 编程代理及多代理工作流的技能 —— 运行独立的代理进程、委派任务,并协调并行工作流。
| 技能 | 描述 | 路径 |
|---|
claude-code | 将编码任务委派给 Claude Code(Anthropic 的 CLI 代理)。适用于构建功能、重构代码、代码审查及迭代式编程。需要已安装 claude CLI。 | autonomous-ai-agents/claude-code |
codex | 将编码任务委派给 OpenAI Codex CLI 代理。适用于构建功能、重构代码、代码审查及批量修复问题。需要已安装 codex CLI 并配置 git 仓库。 | autonomous-ai-agents/codex |
hermes-agent-spawning | 启动额外的 Hermes Agent 实例作为自主子进程,用于独立的长期运行任务。支持非交互式单次模式(-q)和交互式 PTY 模式,实现多轮协作。不同于 delegate_task —— 此方式运行的是完整的独立 hermes 进程。 | autonomous-ai-agents/hermes-agent |
opencode | 将编码任务委派给 OpenCode CLI 代理,用于功能实现、代码重构、代码审查以及长时间的自主会话。需要已安装并认证 opencode CLI。 | autonomous-ai-agents/opencode |
data-science
数据科学工作流相关技能 —— 交互式探索、Jupyter 笔记本、数据分析与可视化。
| 技能 | 描述 | 路径 |
|---|
jupyter-live-kernel | 使用 live Jupyter kernel 实现状态化的、迭代式的 Python 执行(通过 hamelnb)。当任务涉及探索、迭代或检查中间结果时,请加载此技能。 | data-science/jupyter-live-kernel |
creative
创意内容生成 —— ASCII 艺术、手绘风格图表、视觉设计工具。
| 技能 | 描述 | 路径 |
|---|
ascii-art | 使用 pyfiglet(571 种字体)、cowsay、boxes、toilet、图像转 ASCII、远程 API(asciified、ascii.co.uk)以及 LLM 降级方案生成 ASCII 艺术。无需 API 密钥。 | creative/ascii-art |
ascii-video | “ASCII 艺术视频生产流水线 —— 支持任意格式。将视频/音频/图片/生成输入转换为彩色 ASCII 字符视频输出(MP4、GIF、图像序列)。涵盖:视频转 ASCII 转换、音频响应音乐可视化器、生成式 ASCII 动画、混合……” | creative/ascii-video |
excalidraw | 使用 Excalidraw JSON 格式创建手绘风格图表。生成 .excalidraw 文件,适用于架构图、流程图、时序图、概念图等。文件可在 excalidraw.com 打开,或上传以生成可分享链接。 | creative/excalidraw |
p5js | 使用 p5.js 构建交互式与生成式视觉艺术的生产流水线。创建草图,通过无头浏览器渲染为图像/视频,并提供实时预览。支持画布动画、数据可视化和创意编程实验。 | creative/p5js |
devops
DevOps 与基础设施自动化技能。
| 技能 | 描述 | 路径 |
|---|
webhook-subscriptions | 创建和管理 webhook 订阅,实现事件驱动的代理激活。外部服务(GitHub、Stripe、CI/CD、物联网)通过 POST 事件触发代理运行。需要启用 webhook 平台。 | devops/webhook-subscriptions |
dogfood
| 技能 | 描述 | 路径 |
|---|
dogfood | 对 Web 应用进行系统性探索式质量保证测试 —— 发现缺陷、捕获证据,并生成结构化报告。 | dogfood/dogfood |
hermes-agent-setup | 协助用户配置 Hermes Agent —— CLI 使用方法、设置向导、模型/提供商选择、工具、技能、语音/STT/TTS、网关设置,以及故障排查。 | dogfood/hermes-agent-setup |
email
通过终端发送、接收、搜索和管理电子邮件的技能。
| 技能 | 描述 | 路径 |
|---|
himalaya | 通过 IMAP/SMTP 使用 CLI 管理邮件。使用 himalaya 列出、阅读、撰写、回复、转发、搜索和整理邮件。支持多个账户,且可通过 MML(MIME 元语言)进行消息组合。 | email/himalaya |
gaming
用于设置、配置和管理游戏服务器、模组包及游戏相关基础设施的技能。
| 技能 | 描述 | 路径 |
|---|
minecraft-modpack-server | 从 CurseForge/Modrinth 服务器包 ZIP 文件设置模组化 Minecraft 服务器。涵盖 NeoForge/Forge 安装、Java 版本、JVM 调优、防火墙配置、局域网设置、备份机制和启动脚本。 | gaming/minecraft-modpack-server |
pokemon-player | 通过无头模拟器自动运行宝可梦游戏。启动游戏服务器,从内存读取结构化游戏状态,做出战略决策,并发送按键输入 —— 全部通过终端完成。 | gaming/pokemon-player |
github
GitHub 工作流技能,通过 gh CLI 和 git 在终端中管理仓库、拉取请求、代码审查、问题和 CI/CD 流水线。
| 技能 | 描述 | 路径 |
|---|
codebase-inspection | 使用 pygount 分析代码库,统计行数、语言分布和代码/注释比例。当被要求检查代码行数、仓库大小、语言构成或代码库统计数据时使用。 | github/codebase-inspection |
github-auth | 使用 git(通用可用)或 gh CLI 为代理设置 GitHub 认证。涵盖 HTTPS token、SSH 密钥、凭证助手和 gh auth —— 具有自动检测流程,可智能选择合适的方法。 | github/github-auth |
github-code-review | 通过分析 git diff 来审查代码变更,对 PR 添加内联评论,并执行全面的提交前审查。支持 gh CLI,或回退至 git + GitHub REST API(通过 curl)。 | github/github-code-review |
github-issues | 创建、管理、分类和关闭 GitHub 问题。搜索现有问题,添加标签、分配人员,并关联 PR。支持 gh CLI,或回退至 git + GitHub REST API(通过 curl)。 | github/github-issues |
github-pr-workflow | 完整的拉取请求生命周期 —— 创建分支、提交更改、打开 PR、监控 CI 状态、自动修复失败项并合并。支持 gh CLI,或回退至 git + GitHub REST API(通过 curl)。 | github/github-pr-workflow |
github-repo-management | 克隆、创建、分叉、配置和管理 GitHub 仓库。管理远程仓库、密钥、发布版本和工作流。支持 gh CLI,或回退至 git + GitHub REST API(通过 curl)。 | github/github-repo-management |
inference-sh
通过 inference.sh 云平台执行 AI 应用的技能。
| 技能 | 描述 | 路径 |
|---|
inference-sh-cli | 通过 inference.sh CLI(infsh)运行 150+ 个 AI 应用 —— 图像生成、视频创作、大语言模型、搜索、3D、社交自动化等。 | inference-sh/cli |
leisure
| 技能 | 描述 | 路径 |
|---|
find-nearby | 使用 OpenStreetMap 查找附近地点(餐厅、咖啡馆、酒吧、药店等)。支持坐标、地址、城市、邮编或 Telegram 位置标记。无需 API 密钥。 | leisure/find-nearby |
mcp技能:用于与 MCP(模型上下文协议)服务器、工具及集成协作。包含内置的原生 MCP 客户端(通过在 config.yaml 中配置服务器以实现自动工具发现),以及 mcporter CLI 桥接工具,用于临时交互服务器。
| 技能 | 描述 | 路径 |
|---|
mcporter | 使用 mcporter CLI 直接列出、配置、认证并调用 MCP 服务器/工具(支持 HTTP 或 stdio),包括临时服务器、配置修改以及 CLI 和类型生成。 | mcp/mcporter |
native-mcp | 内置的 MCP(模型上下文协议)客户端,可连接外部 MCP 服务器,发现其可用工具,并将其注册为 Hermes Agent 的原生工具。支持 stdio 和 HTTP 传输,具备自动重连、安全过滤和零配置工具注入功能。 | mcp/native-mcp |
用于处理媒体内容的技能 —— YouTube 字幕、GIF 搜索、音乐生成和音频可视化。
| 技能 | 描述 | 路径 |
|---|
gif-search | 使用 curl 从 Tenor 搜索并下载 GIF。仅需 curl 和 jq 依赖。适用于寻找反应类 GIF、创建视觉内容或在聊天中发送 GIF。 | media/gif-search |
heartmula | 部署并运行 HeartMuLa —— 开源音乐生成模型系列(类似 Suno)。可通过歌词 + 标签生成完整歌曲,支持多语言。 | media/heartmula |
songsee | 通过命令行从音频文件生成频谱图和音频特征可视化(如梅尔频谱、音高图、MFCC、节奏图等)。适用于音频分析、音乐制作调试和可视化文档。 | media/songsee |
youtube-content | 获取 YouTube 视频字幕,并将其转换为结构化内容(章节、摘要、话题线、博客文章等)。 | media/youtube-content |
mlops
通用机器学习运维工具 —— 模型仓库管理、数据集操作和工作流编排。
| 技能 | 描述 | 路径 |
|---|
huggingface-hub | Hugging Face Hub CLI(hf)—— 搜索、下载、上传模型与数据集,管理仓库,部署推理端点。 | mlops/huggingface-hub |
mlops/cloud
GPU 云服务商及无服务器计算平台,适用于机器学习负载。
| 技能 | 描述 | 路径 |
|---|
lambda-labs-gpu-cloud | 预留与按需 GPU 云实例,适用于机器学习训练与推理。当需要专用 GPU 实例、简单的 SSH 访问、持久化文件系统,或大规模训练所需的高性能多节点集群时使用。 | mlops/cloud/lambda-labs |
modal-serverless-gpu | 无服务器 GPU 云平台,用于运行机器学习任务。当需要按需获取 GPU 资源而无需管理基础设施、将 ML 模型部署为 API,或运行自动扩缩的批量作业时使用。 | mlops/cloud/modal |
mlops/evaluation
模型评估基准、实验追踪、数据整理、分词器及可解释性工具。
| 技能 | 描述 | 路径 |
|---|
evaluating-llms-harness | 在 60+ 个学术基准上评估大语言模型(MMLU、HumanEval、GSM8K、TruthfulQA、HellaSwag 等)。适用于模型质量评测、模型对比、学术结果报告或训练进度跟踪。行业标准,被 EleutherAI、HuggingFace 及各大研究实验室广泛采用。 | mlops/evaluation/lm-evaluation-harness |
huggingface-tokenizers | 快速分词器,专为科研与生产优化。基于 Rust 实现,1GB 文本分词耗时少于 20 秒。支持 BPE、WordPiece、Unigram 算法。可训练自定义词表,追踪对齐关系,处理填充/截断。与 transformers 无缝集成。 | mlops/evaluation/huggingface-tokenizers |
nemo-curator | GPU 加速的 LLM 训练数据整理工具。支持文本、图像、视频、音频。具备模糊去重(快 16 倍)、质量过滤(30+ 启发式规则)、语义去重、PII 信息脱敏、NSFW 检测等功能。支持跨 GPU 扩展,基于 RAPIDS。适用于构建高质量训练数据集。 | mlops/evaluation/nemo-curator |
sparse-autoencoder-training | 提供使用 SAELens 训练与分析稀疏自编码器(SAE)的指导,将神经网络激活分解为可解释特征。适用于发现可解释特征、分析超叠加现象,或研究语言模型中的单义表示。 | mlops/evaluation/saelens |
weights-and-biases | 使用 W&B(Weights & Biases)跟踪机器学习实验,自动记录日志,实时可视化训练过程,通过超参数搜索优化模型,并管理模型注册中心 —— 协作式 MLOps 平台。 | mlops/evaluation/weights-and-biases |
mlops/inference
模型服务、量化(GGUF/GPTQ)、结构化输出、推理优化及模型手术工具,用于部署和运行大语言模型。
| 技能 | 描述 | 路径 |
|---|
gguf-quantization | GGUF 格式与 llama.cpp 量化技术,实现高效 CPU/GPU 推理。适用于在消费级硬件、Apple Silicon 设备上部署模型,或需要灵活的 2-8 位量化且无需 GPU 支持的场景。 | mlops/inference/gguf |
guidance | 通过正则表达式与语法控制大语言模型输出,确保生成内容为有效 JSON/XML/代码,强制结构化格式,构建多步骤工作流。基于微软研究院的约束生成框架 Guidance。 | mlops/inference/guidance |
instructor | 使用 Pydantic 验证从大语言模型响应中提取的结构化数据,自动重试失败提取,以类型安全方式解析复杂 JSON,支持流式部分结果输出。基于实战验证的结构化输出库 Instructor。 | mlops/inference/instructor |
llama-cpp | 在 CPU、Apple Silicon 及消费级 GPU 上运行大语言模型推理,无需 NVIDIA 硬件。适用于边缘部署、M1/M2/M3 Mac 电脑、AMD/Intel GPU 场景,或 CUDA 不可用时。支持 GGUF 量化(1.5-8 位),降低内存占用,相比 PyTorch 在 CPU 上提速 4-10 倍。 | mlops/inference/llama-cpp |
obliteratus | 使用 OBLITERATUS 工具从开源权重大模型中移除拒绝行为。基于机制可解释性技术(均值差异、SVD、白化 SVD、LEACE、SAE 分解等),在保留推理能力的同时剔除安全护栏。提供 9 种 CLI 方法、28 个分析模块、116 个预设模型配置。 | mlops/inference/obliteratus |
outlines | 保证生成内容的 JSON/XML/代码结构有效性,使用 Pydantic 模型实现类型安全输出,支持本地模型(Transformers、vLLM),并通过 Outlines(dottxt.ai)最大化推理速度。 | mlops/inference/outlines |
serving-llms-vllm | 使用 vLLM 的 PagedAttention 与连续批处理技术,实现高吞吐量的 LLM 服务。适用于部署生产级 LLM API、优化推理延迟/吞吐量,或在 GPU 内存受限情况下服务模型。支持 OpenAI 兼容端点、量化(GPTQ/AWQ/FP8)及动态调度。 | mlops/inference/vllm |
tensorrt-llm | 使用 NVIDIA TensorRT 优化 LLM 推理,实现最大吞吐量与最低延迟。适用于在 NVIDIA GPU(A100/H100)上进行生产部署,需要比 PyTorch 快 10-100 倍的推理性能,或支持量化(FP8/INT4)、飞行中批处理、多模态输入等高级特性。 | mlops/inference/tensorrt-llm |
mlops/models
特定模型架构与工具 —— 计算机视觉(CLIP、SAM、Stable Diffusion)、语音(Whisper)、音频生成(AudioCraft)及多模态模型(LLaVA)。| 技能 | 描述 | 路径 |
|------|------|------|
| audiocraft-audio-generation | 用于音频生成的 PyTorch 库,包括文本转音乐(MusicGen)和文本转声音(AudioGen)。适用于需要根据文本描述生成音乐、创建音效或进行旋律条件下的音乐生成的场景。 | mlops/models/audiocraft |
| clip | OpenAI 的多模态模型,连接视觉与语言能力。支持零样本图像分类、图文匹配及跨模态检索。基于 4 亿组图像-文本对训练。适用于无需微调即可实现图像搜索、内容审核或多模态任务。适合通用用途…… | mlops/models/clip |
| llava | 大型语言与视觉助手。支持视觉指令微调和基于图像的对话交互。结合 CLIP 视觉编码器与 Vicuna/LLaMA 语言模型。支持多轮图像聊天、视觉问答和指令遵循。适用于视觉-语言对话…… | mlops/models/llava |
| segment-anything-model | 面向图像分割的基础模型,具备零样本迁移能力。适用于使用点、框或掩码作为提示来分割图像中的任意对象,或自动提取图像中所有物体的掩码。 | mlops/models/segment-anything |
| stable-diffusion-image-generation | 基于 HuggingFace Diffusers 的 Stable Diffusion 模型,实现顶尖的文生图生成。适用于从文本提示生成图像、图像到图像转换、图像修复,或构建自定义扩散流程。 | mlops/models/stable-diffusion |
| whisper | OpenAI 的通用语音识别模型。支持 99 种语言,具备转录、翻译为英文及语言识别功能。提供从 tiny(39M 参数)到 large(1550M 参数)共六种模型尺寸。适用于语音转文字、播客转录或多语言音频处理…… | mlops/models/whisper |
mlops/research
用于构建和优化 AI 系统的机器学习研究框架,采用声明式编程方式。
| 技能 | 描述 | 路径 |
|---|
dspy | 使用声明式编程构建复杂 AI 系统,自动优化提示词,创建模块化 RAG 系统与智能体。基于斯坦福 NLP 团队开发的 DSPy 框架,实现系统化的语言模型编程 | mlops/research/dspy |
mlops/training
大模型微调、RLHF/DPO/GRPO 训练、分布式训练框架及优化工具,用于训练 LLM 及其他模型。
| 技能 | 描述 | 路径 |
|---|
axolotl | 专家指导:使用 Axolotl 微调 LLM —— YAML 配置文件,支持 100+ 模型,LoRA/QLoRA,DPO/KTO/ORPO/GRPO,多模态支持 | mlops/training/axolotl |
distributed-llm-pretraining-torchtitan | 提供原生 PyTorch 分布式 LLM 预训练能力,基于 torchtitan 实现 4D 并行(FSDP2、TP、PP、CP)。适用于在 8 到 512+ GPU 上大规模预训练 Llama 3.1、DeepSeek V3 或自定义模型,支持 Float8、torch.compile 和分布式检查点。 | mlops/training/torchtitan |
fine-tuning-with-trl | 使用 TRL 进行强化学习微调:SFT 用于指令调优,DPO 用于偏好对齐,PPO/GRPO 用于奖励优化,以及奖励模型训练。适用于需要 RLHF、模型偏好对齐或基于人类反馈训练的场景。兼容 HuggingFace Transformers … | mlops/training/trl-fine-tuning |
grpo-rl-training | 专家指导:使用 TRL 实现 GRPO/RL 微调,用于推理与特定任务的模型训练 | mlops/training/grpo-rl-training |
hermes-atropos-environments | 构建、测试与调试 Hermes Agent 的 RL 训练环境,用于 Atropos 训练。涵盖 HermesAgentBaseEnv 接口、奖励函数设计、智能体循环集成、工具评估、wandb 日志记录,以及三种 CLI 模式(serve/process/evaluate)。适用于创建、审查或优化…… | mlops/training/hermes-atropos-environments |
huggingface-accelerate | 最简单的分布式训练 API。仅需 4 行代码即可为任意 PyTorch 脚本添加分布式支持。统一接口支持 DeepSpeed/FSDP/Megatron/DDP。自动设备分配,混合精度(FP16/BF16/FP8)。交互式配置,单命令启动。HuggingFace 生态标准。 | mlops/training/accelerate |
optimizing-attention-flash | 通过 Flash Attention 优化 Transformer 注意力机制,实现 2-4 倍速度提升,内存减少 10-20 倍。适用于处理长序列(>512 token)时遇到 GPU 内存瓶颈,或需要更快推理性能的场景。支持原生 PyTorch SDPA,… | mlops/training/flash-attention |
peft-fine-tuning | 面向 LLM 的参数高效微调方法,包括 LoRA、QLoRA 及 25+ 种技术。适用于在 GPU 显存有限的情况下微调大型模型(7B-70B),只需训练少于 1% 的参数且保持最小精度损失,或实现多适配器服务。HuggingFace 官方库…… | mlops/training/peft |
pytorch-fsdp | 专家指导:使用 PyTorch FSDP 实现全分片数据并行训练 —— 参数分片、混合精度、CPU卸载、FSDP2 支持 | mlops/training/pytorch-fsdp |
pytorch-lightning | 高层级 PyTorch 框架,包含 Trainer 类、自动分布式训练(DDP/FSDP/DeepSpeed)、回调系统,代码冗余极少。可从笔记本电脑扩展至超级计算机,代码不变。适用于希望拥有内置最佳实践的简洁训练循环。 | mlops/training/pytorch-lightning |
simpo-training | 简化版偏好优化(Simple Preference Optimization),用于 LLM 对齐。无需参考模型的 DPO 替代方案,性能更优(AlpacaEval 2.0 上高出 +6.4 分)。比 DPO 更高效。适用于希望以更简单、更快的方式实现偏好对齐,而非 DPO/PPO 的场景。 | mlops/training/simpo |
slime-rl-training | 提供使用 slime(Megatron+SGLang 框架)进行 LLM 后训练的指导。适用于训练 GLM 模型、实现自定义数据生成流程,或需要紧密集成 Megatron-LM 以实现强化学习扩展的场景。 | mlops/training/slime |
unsloth | 专家指导:使用 Unsloth 实现快速微调 —— 训练速度提升 2-5 倍,内存占用减少 50-80%,支持 LoRA/QLoRA 优化 | mlops/training/unsloth |
mlops/vector-databases
向量相似性搜索与嵌入数据库,用于 RAG、语义搜索及 AI 应用后端。
| 技能 | 描述 | 路径 |
|---|
chroma | 开源嵌入数据库,专为 AI 应用设计。存储嵌入向量与元数据,支持向量搜索与全文检索,按元数据过滤。提供简单的四功能 API。可从笔记本扩展至生产集群。适用于语义搜索、RAG 应用或文档检索。最适合…… | mlops/vector-databases/chroma |
faiss | Facebook 开发的高效密集向量相似性搜索与聚类库。支持数十亿向量,GPU 加速,多种索引类型(Flat、IVF、HNSW)。适用于快速 k-NN 搜索、大规模向量检索,或仅需纯相似性搜索而无需额外功能的场景。 | mlops/vector-databases/faiss |
pinecone | 用于生产级 AI 应用的托管向量数据库。完全托管,自动伸缩,支持混合搜索(稠密 + 稀疏)、元数据过滤与命名空间。延迟极低(p95 低于 100ms)。适用于生产环境中的 RAG、推荐系统或大规模语义搜索。最适合服务器…… | mlops/vector-databases/pinecone |
qdrant-vector-search | 高性能向量相似性搜索引擎,专为 RAG 与语义搜索设计。适用于构建需要快速最近邻搜索、带过滤的混合搜索,或具备 Rust 驱动高性能的可扩展向量存储的生产级 RAG 系统。 | mlops/vector-databases/qdrant |
note-taking
笔记记录技能,用于保存信息、辅助研究,以及多会话协作规划与信息共享。
| 技能 | 描述 | 路径 |
|---|
obsidian | 在 Obsidian 仓库中读取、搜索和创建笔记。 | note-taking/obsidian |
productivity
文档创作、演示文稿、电子表格及其他生产力工作流相关技能。| Skill | 描述 | 路径 |
|-------|-------------|------|
| google-workspace | 通过 Python 集成 Gmail、日历、Drive、联系人、表格和文档。使用 OAuth2 并支持自动令牌刷新。无需外部二进制文件——完全在 Hermes 虚拟环境中的 Google 官方 Python 客户端库运行。 | productivity/google-workspace |
| linear | 通过 GraphQL API 管理 Linear 的问题、项目和团队。可创建、更新、搜索和组织问题。 | productivity/linear |
| nano-pdf | 使用 nano-pdf CLI 通过自然语言指令编辑 PDF 文件。修改文本、修正拼写错误、更新标题,并对特定页面进行内容更改,无需手动编辑。 | productivity/nano-pdf |
| notion | 通过 curl 使用 Notion API 创建和管理页面、数据库及区块。直接从终端查询、创建、更新和检索 Notion 工作区内容。 | productivity/notion |
| ocr-and-documents | 从 PDF 和扫描文档中提取文本。使用 web_extract 处理远程 URL,pymupdf 处理本地文本型 PDF,marker-pdf 处理 OCR/扫描文档。DOCX 使用 python-docx,PPTX 参见 powerpoint 技能。 | productivity/ocr-and-documents |
| powerpoint | 任何涉及 .pptx 文件的情况都应使用此技能——无论是作为输入、输出或两者兼有。包括:创建幻灯片演示文稿、商业计划书或演讲稿;读取、解析或提取任意 .pptx 文件中的文本(即使提取内容将用于其他用途,如…… | productivity/powerpoint |
适用于学术研究、论文发现、文献综述、领域侦察、市场数据、内容监控和科学知识检索的技能。
| 技能 | 描述 | 路径 |
|---|
arxiv | 使用 arXiv 免费 REST API 搜索并获取学术论文。无需 API 密钥。可通过关键词、作者、类别或 ID 进行搜索。可结合 web_extract 或 ocr-and-documents 技能阅读完整论文内容。 | research/arxiv |
blogwatcher | 使用 blogwatcher CLI 监控博客和 RSS/Atom 频道的更新。添加博客源,扫描新文章,并追踪已读内容。 | research/blogwatcher |
llm-wiki | Karpathy 的 LLM Wiki — 构建并维护一个持久、相互链接的 Markdown 知识库。导入资料源,查询整合后的知识,并进行一致性校验。与 RAG 不同,该维基知识一次性编译并持续保持最新状态。可作为 Obsidian 仓库使用。通过 skills.config.wiki.path 配置。 | research/llm-wiki |
domain-intel | 使用 Python 标准库进行被动域名侦察。包括子域名发现、SSL 证书检查、WHOIS 查询、DNS 记录分析、域名可用性检测以及批量多域名分析。无需 API 密钥。 | research/domain-intel |
duckduckgo-search | 通过 DuckDuckGo 进行免费网络搜索——文本、新闻、图片、视频。无需 API 密钥。若已安装 ddgs CLI,优先使用;仅在确认当前运行时存在 ddgs 后才使用 Python DDGS 库。 | research/duckduckgo-search |
ml-paper-writing | 为 NeurIPS、ICML、ICLR、ACL、AAAI、COLM 等会议撰写符合发表标准的机器学习/AI 论文。适用于从研究仓库起草论文、构建论证结构、验证引用或准备最终提交版本。包含 LaTeX 模板、审稿指南和引用验证功能。 | research/ml-paper-writing |
polymarket | 查询 Polymarket 预测市场数据——搜索市场、获取价格、订单簿和价格历史记录。通过公开 REST API 读取,无需 API 密钥。 | research/polymarket |
红队测试
用于大模型红队测试、越狱攻击和安全过滤绕过研究的技能。
| 技能 | 描述 | 路径 |
|---|
godmode | 使用 G0DM0D3 技术越狱通过 API 提供的大模型——包括帕瑟尔通格输入混淆(33 种技术)、GODMODE CLASSIC 系统提示模板、ULTRAPLINIAN 多模型竞速、编码升级以及 Hermes 原生预填充/系统提示集成。适用于任何可通过 API 访问的模型,包括闭源模型。 | red-teaming/godmode |
智能家居
控制智能设备——灯光、开关、传感器和家庭自动化系统的技能。
| 技能 | 描述 | 路径 |
|---|
openhue | 通过 OpenHue CLI 控制 Philips Hue 灯具、房间和场景。可开关灯光、调节亮度、颜色、色温,并激活场景。 | smart-home/openhue |
社交媒体
与社交平台交互的技能——发布、阅读、监控和账户操作。
| 技能 | 描述 | 路径 |
|---|
xitter | 使用官方 X API 凭据通过 x-cli 终端客户端与 X/Twitter 互动。 | social-media/xitter |
软件开发
| 技能 | 描述 | 路径 |
|---|
code-review | 执行全面代码审查的指南,重点关注安全性和质量 | software-development/code-review |
plan | Hermes 的规划模式——检查上下文,在活动工作区/后端工作目录中的 .hermes/plans/ 写入 Markdown 规划文档,且不执行实际工作。 | software-development/plan |
requesting-code-review | 在完成任务、实现主要功能或合并前使用。通过系统化审查流程验证工作是否满足需求。 | software-development/requesting-code-review |
subagent-driven-development | 在执行实施计划且任务独立时使用。为每个任务分派新的 delegate_task,并采用两阶段评审(规范合规性 → 代码质量)。 | software-development/subagent-driven-development |
systematic-debugging | 遇到任何 bug、测试失败或异常行为时使用。四阶段根本原因调查——在理解问题之前绝不修复。 | software-development/systematic-debugging |
test-driven-development | 在实现任何功能或修复 bug 之前使用,编写实现代码前。强制执行 RED-GREEN-REFACTOR 循环,采用测试先行方法。 | software-development/test-driven-development |
writing-plans | 当你拥有一个多步骤任务的规格或需求时使用。创建包含小块任务、精确文件路径和完整代码示例的综合实施计划。 | software-development/writing-plans |
可选技能
可选技能随仓库一起提供,位于 optional-skills/,但默认未启用。它们涵盖更重或更小众的用例。通过以下方式安装:
hermes skills install official/<category>/<skill>
自主 AI 代理
| 技能 | 描述 | 路径 |
|---|
blackbox | 将编码任务委派给 Blackbox AI CLI 代理。具备内置评判器的多模型代理,通过多个 LLM 运行任务并选择最佳结果。需要 blackbox CLI 和 Blackbox AI API 密钥。 | autonomous-ai-agents/blackbox |
区块链
| 技能 | 描述 | 路径 |
|---|
base | 使用 Base(以太坊 L2)区块链数据查询 USD 定价信息——钱包余额、代币信息、交易详情、Gas 分析、合约检查、鲸鱼检测和实时网络统计数据。使用 Base RPC + CoinGecko。无需 API 密钥。 | blockchain/base |
solana | 使用 Solana 区块链数据查询 USD 定价信息——钱包余额、带价值的代币组合、交易详情、NFT、鲸鱼检测和实时网络统计数据。使用 Solana RPC + CoinGecko。无需 API 密钥。 | blockchain/solana |
创意创作
| 技能 | 描述 | 路径 |
|---|
blender-mcp | 通过 socket 连接 Hermes 直接控制 Blender,使用 blender-mcp 插件。创建 3D 对象、材质、动画,并运行任意 Blender Python (bpy) 代码。 | creative/blender-mcp |
meme-generation | 使用 Pillow 选取模板并叠加文字生成真实表情包图像,输出实际的 .png 表情包文件。 | creative/meme-generation |
DevOps
| 技能 | 描述 | 路径 |
|---|
docker-management | 管理 Docker 容器、镜像、卷、网络和 Compose 堆栈——生命周期操作、调试、清理和 Dockerfile 优化。 | devops/docker-management |
邮件| 技能 | 描述 | 路径 |
|------|------|------|
| agentmail | 通过 AgentMail 为代理配置专属电子邮件收件箱。使用代理拥有的邮箱地址(如 hermes-agent@agentmail.to)自主发送、接收和管理邮件。 | email/agentmail |
| 技能 | 描述 | 路径 |
|---|
neuroskill-bci | 连接到正在运行的 NeuroSkill 实例,将用户实时的认知与情绪状态(专注度、放松度、情绪、认知负荷、困倦程度、心率、心率变异性、睡眠阶段以及40多个衍生脑电指标)融入响应中。需要配备脑机接口可穿戴设备(如 Muse 2/S 或 OpenBCI)及 NeuroSkill 桌面应用程序。 | health/neuroskill-bci |
mcp
| 技能 | 描述 | 路径 |
|---|
fastmcp | 使用 Python 中的 FastMCP 构建、测试、检查、安装和部署 MCP 服务器。适用于创建新的 MCP 服务器、将 API 或数据库封装为 MCP 工具、暴露资源或提示词,或为 HTTP 部署准备 FastMCP 服务器。 | mcp/fastmcp |
| 技能 | 描述 | 路径 |
|---|
openclaw-migration | 将用户的 OpenClaw 自定义配置迁移至 Hermes Agent。从 ~/.openclaw 目录导入兼容 Hermes 的记忆数据、SOUL.md、命令允许列表、用户技能及选定的工作区资产,并报告无法迁移的内容及其原因。 | migration/openclaw-migration |
生产力
| 技能 | 描述 | 路径 |
|---|
telephony | 为 Hermes 提供手机功能——配置并持久化 Twilio 号码,发送和接收短信/MMS,直接拨打电话,以及通过 Bland.ai 或 Vapi 发起 AI 驱动的外呼。 | productivity/telephony |
| 技能 | 描述 | 路径 |
|---|
bioinformatics | 通往 bioSkills 和 ClawBio 提供的 400 多项生物信息学技能的入口。涵盖基因组学、转录组学、单细胞分析、变异检测、药物基因组学、宏基因组学、结构生物学等多个领域。 | research/bioinformatics |
qmd | 使用 qmd —— 一种结合 BM25、向量搜索和大模型重排序的混合检索引擎,在本地搜索个人知识库、笔记、文档和会议记录。支持命令行界面和 MCP 集成。 | research/qmd |
| 技能 | 描述 | 路径 |
|---|
1password | 设置并使用 1Password CLI(op)。适用于安装 CLI、启用桌面应用集成、登录账户,以及在命令中读取或注入密钥。 | security/1password |
oss-forensics | 针对 GitHub 仓库的供应链调查、证据恢复与取证分析。涵盖已删除提交的恢复、强制推送检测、IOC 提取、多源证据收集及结构化取证报告生成。 | security/oss-forensics |
sherlock | 在 400 多个社交平台进行 OSINT 用户名搜索。通过用户名追踪目标的社交媒体账号。 | security/sherlock |