Skip to content
Zero Click Daily
Go back

🐝 Hermes 日报 — 2026-05-12

🐝 Hermes 日报 — 2026-05-12

版本状态


更新摘要(精简)

远程 main 有大量新提交(20+),核心变更按类别分:

新功能:

Bug 修复:

改进优化:


社区动态与深度玩法

1. A2A(Agent-to-Agent)协议支持讨论持续升温

来源: GitHub Issue #514 · 13 条评论

这条 Feature Request 已经成为社区讨论跨框架 Agent 互操作的核心阵地。A2A 协议由 Google 主导(Apache 2.0,托管于 Linux Foundation),核心解决”谁可以帮我”的问题——与 MCP 的”我能用什么工具”形成互补。

讨论中涌现了几个有价值的技术观点:

实操价值: 如果你正在做多 Agent 系统,A2A 值得关注。Hermes 一旦支持,理论上可以与 LangChain/AutoGen/CrewAI 构建的 Agent 互相发现和委托任务。


2. Auxiliary Fallback 系统与用户 fallback_providers 互不相认——架构级设计缺陷

来源: GitHub Issue #24039 · Collaborator 标记

这个问题揭示了 Hermes 内部存在两套并行的 fallback 系统

问题: 后者完全无视前者的配置。用户以为自己的免费模型链会被 auxiliary 任务使用,实际上 auxiliary 可能在烧付费模型(如 Gemini 3 Flash Preview)。

相关 PR #24036 修了 OpenRouter 路径的即时问题,但更大范围的架构统一(让 auxiliary fallback 复用 fallback_providers)仍在讨论中。

实操价值: 如果你使用免费模型链 + auxiliary 任务,检查一下 ~/.hermes/logs/agent.log 确认 auxiliary 实际调用的模型,避免隐性成本。


3. Smart Model Routing 的 Preflight Compression 陷阱

来源: GitHub Issue #7798 · P1 优先级

smart_model_routing 将某个 turn 路由到便宜模型时,Hermes 会重建 AIAgent 实例,而新的 ContextCompressor 绑定的是便宜模型的 context_length。如果便宜模型的上下文窗口比主模型小,Preflight Compression 会误判历史过长,在用户发送简单消息时触发不必要的历史压缩。

修复方案(PR #7799):

  1. Smart-routed turns 跳过 preflight compression
  2. resolve_turn_route 新增上下文窗口容量检查——当预估请求超过便宜模型窗口的 50% 时,拒绝降级路由

实操价值: 使用 smart_model_routing 的用户如果发现会话历史被意外压缩,这就是原因。临时解决方案是给便宜模型设置合理的 context_length


4. Claude Max OAuth Token 被拒——HTTP 400 的多层原因

来源: GitHub Issue #15080 · P1 · 10 条评论

Claude Max 20x 订阅用户使用 ~/.claude/.credentials.json 中的 OAuth token 通过原生 Anthropic API 调用时,所有请求被 HTTP 400 拒绝。

讨论揭示这不是简单的重复 issue:虽然表面报错与 #10575 相同,但即使用户应用了 PR #10576 的修复(sanitizer 改动)后仍然失败。用户验证发现即使 tools=False(不传工具定义)也会被拒,说明问题可能出在 Anthropic 的 Claude Max proxy 对请求格式的严格校验上。

实操价值: 如果你使用 Claude Max 订阅通过 Hermes 调用原生 Anthropic API,目前可能需要通过 OpenRouter 中转而非直连。


5. Hermes Web UI 社区项目已达 4400+ Star

来源: EKKOLearnAI/hermes-web-ui · GitHub

这是一个由社区维护的 Hermes Agent Web Dashboard,提供多平台 AI 聊天、会话管理、定时任务管理、用量分析等功能。4400+ Star 说明 Hermes 的 Web 管理界面需求旺盛——官方目前以 TUI 和 Gateway 为主,Web UI 由社区填补。

实操价值: 如果你需要给团队提供一个 Web 界面来管理 Hermes Agent(而不是每个人都 SSH 进服务器),这个项目值得一看。


6. 新 Optional Skills:Hyperliquid(加密市场)+ Stocks(股票行情)

来源: optional-skills/ 目录 · origin/main

两个新技能都使用纯 Python stdlib,零外部依赖:

安装方式(拉取最新代码后):

cp -r optional-skills/blockchain/hyperliquid ~/.hermes/skills/blockchain/
cp -r optional-skills/finance/stocks ~/.hermes/skills/finance/

实操价值: 配合 Hermes 的 Cron 功能,可以定时抓取市场数据并推送报告到 Telegram/飞书——轻量级量化监控方案。


玩机技巧:跨会话 Prompt Caching 省钱大法

本周 Hermes 合并了 #23828——跨会话 1 小时前缀缓存。这是 Claude 用户的省钱利器:

工作原理

缓存层              内容                     TTL    作用域
──────────────────────────────────────────────────────────────
Breakpoint 1       tools[-1]                 1h    跨会话
Breakpoint 2       stable system prefix      1h    跨会话  
Breakpoint 3+      volatile suffix + memory  5min  会话内

系统提示被拆分为稳定前缀(不变的部分)和易变后缀(时间戳、memory snapshot 等)。稳定部分在 1 小时内跨会话复用,首轮输入成本降低约 85-90%。

适用条件

最佳实践

# 如果你频繁开新 session(比如 Cron Job),这几乎是免费的
# 确保你的 provider 支持 prompt caching
hermes config get model.provider
# 应该是 anthropic / openrouter / nous 之一

# 查看缓存命中情况(verbose 模式)
hermes chat -v
# 首轮输出中会显示 cache_creation_input_tokens / cache_read_input_tokens

Cron Job 场景特别划算:每小时跑一次的定时任务,系统提示 + 工具定义约 10K-30K tokens,原本每轮都付全价,现在 1 小时内只有首次付费。


Share this post on:

Previous Post
🐝 Hermes 日报 — 2026-05-13
Next Post
🐝 Hermes 日报 — 2026-05-11