Hermes 日报 · 2026-05-23
版本状态
- 最新发布: v0.14.0 (v2026.5.16) — “The Foundation Release”
- 本地跟踪: HEAD 落后 origin/main 147 commits(719 commits since v0.14.0 tag)
- 变更规模: 329 files changed, +20,284 / -3,965 lines
- 下一个版本: v0.15.0 开发中(预计 5 月底)
v0.14.0 重磅回顾
v0.14.0 是 Hermes Agent 迄今最大的一次发布:808 commits · 633 merged PRs · 1,393 files changed · 165K insertions · 545 issues closed (12 P0 + 50 P1) · 215 位社区贡献者。
核心亮点:
- xAI Grok OAuth + grok-4.3 1M 上下文 — SuperGrok 订阅用户直接浏览器 OAuth 登录,无需 API Key,grok-4.3 上下文窗口扩展到 100 万 tokens
- OpenAI 兼容本地代理 —
hermes proxy启动一个 localhost OpenAI 端点,任何支持 OpenAI API 的工具(Codex CLI、Aider、Cline、Continue)直接走你的 OAuth 订阅(Claude Pro、ChatGPT Pro、SuperGrok),一次订阅全家桶 x_search首次集成 — X (Twitter) 搜索成为一等公民工具,OAuth 或 API Key 认证- Microsoft Teams 全链路 — Graph 认证 + Webhook + Pipeline + 发消息,端到端
- Debloating — 重型依赖 lazy-install,
pip install hermes-agent瘦身,PyPI 正式包 - 冷启动优化 -19s —
hermes启动快了约 19 秒,hermes tools全平台页从 14s 降到 <1.5s - Browser CDP 180x — 浏览器控制台调用从秒级降到毫秒级(持久 CDP WebSocket)
- LINE + SimpleX Chat — 新增两个消息平台,总计 22 个
- 跨会话 Claude prompt 缓存 1h — 同一小时内的
/new会话复用缓存前缀,更快更省 /handoff真正的实时会话迁移 — 模型/人格/Profile 之间无缝切换- LSP 语义诊断 — 每次
write_file/patch后自动跑 LSP,即时捕获类型错误 computer_usecua-driver — 非 Anthropic 模型也能驱动桌面 GUI- Windows 原生 Beta — cmd.exe / PowerShell 原生运行,无需 WSL
自 v0.14.0 以来的新动向(origin/main 新增 147 commits)
🔒 安全修复(9 项)
这是一波密集的安全加固:
- Nous URL Allowlist — Portal 的
inference_base_url现在校验 host allowlist,防止恶意端点(fix(security): validate Nous Portal inference_base_url against host allowlist) - Control-plane 文件保护 —
fix(security): protect Hermes control-plane files from prompt injection,阻止通过 prompt 注入覆盖 Hermes 自身的控制文件 - Profile 模式写保护扩展 —
<root>/control-files也在 write-deny 范围内 - Pairing codes 哈希存储 — 不再明文存储 gateway pairing codes,改用 hash(
fix(security): hash gateway pairing codes instead of storing plaintext) - Webhook HMAC bypass 修复 —
_reload_dynamic_routes现在校验 secret,防止空 secret 绕过 HMAC(fix(security): validate secret in _reload_dynamic_routes to prevent HMAC bypass) - API Key 泄露防护 — 自定义端点不再接收用户 API Key(
fix(security): prevent API key leakage to non-authoritative custom endpoints) - Credentials 来源标签 — Bitwarden 检测到的凭证现在标注来源
⚡ 性能优化
- Termux 冷启动加速 — 多项优化:bare CLI prompt 加速、
hermes --versionfast-path、TUI cold start 加速 - Adaptive subprocess poll — 每次 tool call 节省 ~195ms(
perf(terminal): adaptive subprocess poll cuts ~195ms off every tool call)
🔧 关键修复
- Discord adapter → bundled plugin — 完成与 Teams 等价的迁移,Discord adapter 作为 bundled plugin 运行
- MiniMax OAuth token 刷新 — 短生命周期 access token 每次请求刷新
- Aux model picker 补全 — 补齐缺失的 aux model slots
- Computer use 大修 — SOM/vision capture 路由修复、element 标签解析修复、AX elements array cap 防上下文爆炸
- Agent 工具链修复 —
supports_vision声明支持用户配置、list-type tool content 恢复、memory tool 注入受 enabled_toolsets 约束
🆕 新功能
- Bitwarden Secrets Manager 集成 —
feat(secrets): Bitwarden Secrets Manager integration with lazy bws install,lazy 安装bwsCLI - xAI 模型退休检测 — 检测已退休的 xAI 模型并警告,
hermes migrate xai迁移工具 - xAI Web Search 插件 —
feat(web): add xAI Web Search provider plugin - Per-session JSON snapshot — opt-in 的会话快照写入器
- TUI 鼠标追踪 — DEC mode presets
- Browser CDP 自动启动 — Chromium 家浏览器自动检测并启动 CDP
🔄 重构
- Session 日志清理 — 删除
_save_session_log、_clean_session_content、JSONL fallback,state.db 成为唯一 canonical 来源 - Anthropic adapter 拆分 —
convert_messages_to_anthropic提取 7 个 helpers - FAL image_gen → plugins — 继续将 image_gen 后端迁移到 plugin 架构
- Gateway mirror — 停止写 JSONL,完全走 SQLite
社区动态
教程和指南(持续增长)
- DigitalOcean 官方教程(5月12日)— 如何在 DO Droplet 上部署 Hermes + Telegram + 自定义 Skill(杂货追踪 Agent 示例),详尽的 step-by-step
- Hostinger Docker 部署指南(4月24日)— Docker VPS 部署完整 walkthrough
- hermes-agent.ai Setup Guide(5月17日)— 从零到运行的 20 分钟安装指南,覆盖全平台
- Hermes Atlas 完整入门指南(4月20日)— 基于 100+ 生态项目和 33 研究源,覆盖安装、模型选择、学习循环、推荐 skills
- GrandLinux 多平台安装指南(5月16日)— macOS / Linux / Windows / Android / Docker / VPS 全覆盖
awesome-hermes-agent
- 新增 triage:合并 6 个社区 issue suggestions (#77)
PR 活跃度
最近合并的重要 PR:
feat(xai-oauth): xAI Grok OAuth provider(+4009/-154,32 files)— @teknium1feat(nvidia): NIM billing origin header — NVIDIA 贡献者 @kchantharuan- 社区贡献者持续增加:new AUTHOR_MAP entries for sgtworkman, rodrigoeqnit, Stark-X, YarrowQiao 等
玩机技巧:Browser 自动化进阶
Hermes 的 Browser 工具栈在 v0.14.0 之后迎来了重大升级。以下是实际使用中的几个技巧:
1. CDP 自动启动
现在无需手动配置 Chrome 路径。当 browser_navigate 被调用时,Hermes 会自动检测系统中的 Chromium 家浏览器(Chrome、Chromium、Brave、Edge)并启动 CDP 调试模式。在 macOS 上还会自动检测 Intel vs Apple Silicon 来选择正确的 CUA 资产。
2. 持久连接性能
v0.14.0 将每次 browser_console 调用从「新建 DevTools session → 执行 → 关闭」改为「共享持久 CDP WebSocket」。实测从 ~2s/call 降到 ~11ms/call,180x 提速。在复杂页面交互场景中这个差距非常明显。
3. 自动截图策略
结合 browser_vision(视觉分析)和 browser_snapshot(无障碍树),可以高效处理:
- 需要理解布局/图片:用
browser_vision - 需要定位可交互元素:用
browser_snapshot(返回 ref ID 供browser_click使用) - 两者结合可以处理几乎任何网页交互场景
4. 代理模式
hermes proxy 启动后,Playwright MCP 或其他浏览器自动化工具可以直接走 Hermes 的浏览器会话,实现跨工具协作。
数据来源: origin/main git log (147 commits since local HEAD), GitHub API, Exa Search 下期预告: 关注 v0.15.0 开发进度,安全加固浪潮是否会持续