🔥 今日最热
666ghj/MiroFish — 群体智能预测引擎 +320⭐
[Agent应用] [预测] [多Agent]
是什么:MiroFish 是一个下一代 AI 预测引擎,核心思路是从现实世界提取”种子信息”(突发新闻、政策草案、金融信号),自动构建一个高保真的平行数字世界。在这个世界里,成千上万个拥有独立人格、长期记忆和行为逻辑的智能体自由交互,通过模拟涌现出对现实事件的预测。由盛大出品。
解决什么问题:传统预测方法(专家预测、统计模型、单一 LLM 推理)各有局限——专家主观性强、统计模型滞后、LLM 缺乏”群体智慧”。MiroFish 用多 Agent 社会模拟来弥补这些空白,让预测不是靠一个”超级大脑”而是靠”模拟社会”的涌现行为。
为什么值得关注:这是多 Agent 系统从”工具”走向”社会模拟”的标志性项目。群体智能(Swarm Intelligence)一直是 AI 研究的前沿方向,但大多停留在论文阶段。MiroFish 把它产品化、通用化了。如果其预测精度能持续验证,将对金融、政策、舆情等领域产生实际影响。
withastro/flue — Astro 团队出品的 Agent 框架 +126⭐
[Agent框架] [TypeScript] [新发布]
是什么:Flue 是 Astro(知名 Web 框架)团队推出的 Agent Harness 框架。核心理念:如果你会用 Claude Code,你就已经知道怎么用 Flue 构建 Agent 了。它是 100% headless、可编程的 TypeScript 框架——没有 TUI、没有 GUI,Agent 的”逻辑”几乎全写在 Markdown(skills、context、AGENTS.md)里,而非代码中。一次编写,可构建多运行时目标。
解决什么问题:当前 Agent 框架要么是黑盒(Claude Code、Codex),要么是重量级 SDK(LangChain、CrewAI)。Flue 填补了一个空白:用你已有的 Claude Code 工作流知识,构建可编程、可部署、运行时无关的自主 Agent。从”辅助编码的 Agent”到”你可以构建的 Agent”。
为什么值得关注:Astro 是 Web 开发领域最受尊重的框架团队之一(Star 数在 SSG 领域领先),他们进入 Agent 框架领域本身就是一个强信号。Flue 的”Markdown-first”理念与 ECC、learn-claude-code 的”harness engineering”思路高度一致——Agent 的逻辑不应硬编码在 Python/TS 中,而应以声明式的 Markdown 为载体。
MemPalace/mempalace — 最佳基准的开源 AI 记忆系统 +227⭐
[记忆] [Agent基础设施] [开源]
是什么:MemPalace 号称是基准测试表现最好的开源 AI 记忆系统,完全免费。它采用 local-first 架构,提供逐字记忆(verbatim memory)功能,专为 Claude Code 等编码 Agent 设计。项目特别强调安全性,在 README 顶部放置了防诈骗警告(因已出现冒充网站)。
解决什么问题:当前 AI Agent 的记忆系统主要分两类——简单键值存储(ChatGPT 记忆)和向量数据库(RAG)。两者都无法提供精确的上下文回忆。MemPalace 提供了”逐字回忆”能力,让 Agent 能准确记住之前的对话和决策,而不只是语义相似度检索。
为什么值得关注:时机非常巧妙——就在昨天 OpenAI 发布 Dreaming 记忆系统的同一天,MemPalace 以开源方式提供了替代方案。如果其基准测试声称属实,这将是 Agent 记忆基础设施的一个重要开源选择。其 local-first 设计也回应了企业对数据隐私的关切。
🔗 github.com/MemPalace/mempalace
🔥 持续热门
| 项目 | 今日变化 | 累计 Star | 首次报道 |
|---|---|---|---|
| headroom | +2,473⭐ | 持续爆发 | 06-03 |
| open-notebook | +1,152⭐ | 大幅加速 | 06-05 |
| last30days-skill | +731⭐ | 增速显著 | 06-05 |
| PaddleOCR | +747⭐ | 70K+ | 06-05 |
| ECC | 稳定 | 208K+ | 06-04 |
| copilot-sdk | +309⭐ | 稳定增长 | 06-05 |
| openclaw-windows | +326⭐ | 稳定增长 | 06-05 |
| NVIDIA Cosmos | +479⭐ | 持续增长 | 06-05 |
| learn-claude-code | 稳定 | 64K+ | 06-04 |
| career-ops | 稳定 | 48K+ | 06-04 |
🧩 Agent 生态
Panniantong/Agent-Reach — Agent 互联网感知能力 +148⭐
[Agent工具] [数据采集]
是什么:给 AI Agent 装上”眼睛”的工具——一个 CLI 即可读取和搜索 Twitter、Reddit、YouTube、GitHub、Bilibili、小红书等平台,零 API 费用。支持 Python 3.10+,MIT 协议。
为什么值得关注:Agent 最大的短板之一就是”看不见互联网”。Agent-Reach 用爬虫/解析方式绕过各平台的付费 API,为 Agent 提供了即时、免费的互联网感知能力。与 last30days-skill 的”研究聚合”形成互补——一个解决”搜得到”,一个解决”综合得好”。
🔗 github.com/Panniantong/Agent-Reach
CopilotKit/CopilotKit — AG-UI Protocol 前端 Agent 栈 +366⭐
[Agent框架] [前端] [协议]
是什么:构建 agent-native 应用的前端框架栈,支持 React、Angular、Vue、React Native。核心是 AG-UI Protocol——一个标准化 Agent 与前端交互的协议,提供 Generative UI、共享状态和人机协作工作流。
为什么值得关注:当 Agent 从 CLI 走向产品,前端如何与 Agent 交互成为关键问题。AG-UI Protocol 试图定义一个标准协议层,类似于 MCP 标准化了 Agent 与工具的交互,AG-UI 标准化 Agent 与 UI 的交互。+366⭐ 说明开发者社区对这个方向的认可。
🔗 github.com/CopilotKit/CopilotKit
openai/plugins — OpenAI Codex 插件合集 +49⭐
[工具链] [插件]
是什么:OpenAI 官方的 Codex 插件示例仓库,包含 Figma、Notion、iOS/macOS/Web 应用构建、Expo、Netlify 等多个实用插件。每个插件包含 manifest、skills、hooks、agents 等完整结构。
为什么值得关注:展示了 OpenAI 对 Codex 插件生态的官方设计规范。对于构建 Codex 插件或理解 Agent 插件架构(manifest + skills + hooks + agents)的人来说,这是最权威的参考实现。
🤖 模型与推理
Ollama 大幅改进 GGUF 性能与模型支持 [新发布]
Ollama 发布博客,宣布对 GGUF 格式推理的性能优化和更广泛的模型支持。GGUF 是 llama.cpp 生态的核心格式,Ollama 的持续优化意味着本地推理的性能天花板在不断提高。
🔗 ollama.com — Improved performance and model support with GGUF
Google 发布 Gemma 4 QAT 模型 [新发布]
[量化] [移动端]
Google 发布 Gemma 4 的量化感知训练(QAT)模型,专门优化模型压缩在手机和笔记本电脑上的推理效率。QAT 在训练阶段就考虑量化损失,比训练后量化(PTQ)能保持更高的精度。
🔗 blog.google — Gemma 4 QAT models
vLLM Semantic Router v0.3 Themis — 有状态生产路由 [新发布]
[推理] [路由]
vLLM 发布 Semantic Router v0.3(代号 Themis),从信号驱动升级为有状态的生产级路由。支持基于模型负载、请求优先级、SLA 等维度的动态路由决策,适用于多模型混部的大规模推理集群。
🔗 vllm.ai — Semantic Router v0.3 Themis
- HuggingFace: Nemotron 3.5 Content Safety — NVIDIA 发布可定制化的多模态安全模型,面向全球企业 AI 部署。链接
- HuggingFace: EVA-Bench Data 2.0 — ServiceNow 发布企业 Agent 评测基准,覆盖 3 个领域、121 个工具、213 个场景。链接
- HuggingFace: Thousand Token Wood — 用 3B 模型实现多 Agent 经济系统的 hackathon 项目。链接
- HuggingFace: hf CLI for Agents — 重新设计 HuggingFace CLI 为 Agent 优化的 Hub 工作流。链接
🛡️ 安全与伦理
OpenAI 推出 Lockdown Mode [新功能]
[安全] [产品]
Simon Willison 报道了 OpenAI 新推出的 Lockdown Mode(锁定模式)。这是一种增强的安全模式,限制 ChatGPT 的某些功能以防止在特定场景下的误用或数据泄露。OpenAI 逐步为企业和高安全需求用户构建分层安全控制。
🔗 simonwillison.net — OpenAI Help: Lockdown Mode
- HuggingFace: Nemotron 3.5 Content Safety (HuggingFace Blog) — NVIDIA 发布可定制多模态内容安全模型,支持多语言和企业自定义安全策略。链接
🏭 行业动态
- HuggingFace: hf CLI for Agents (HuggingFace Blog) — HF 重新设计 CLI 为 Agent 优化的 Hub 工作流,标志着 AI 基础设施平台全面适配 Agent 生态。链接
- Google AI May 2026 Roundup (Google AI Blog) — Google 5 月 AI 动态汇总。链接
- Latent Space: How to Stop Shipping Low-Quality RL Environments (Latent Space) — 关于 RL 训练环境质量标准化的讨论。链接
- Latent Space: AINews (Latent Space) — 本日 AI 新闻速递。链接
- Simon Willison: Quoting Andreas Kling (Simon Willison) — 关于浏览器引擎和 AI 的思考。链接
🔮 趋势总结
1. Agent 框架进入”Web 框架化”时代:Astro(Flue)、CopilotKit(AG-UI Protocol)的出现,标志着 Agent 框架正在复刻 Web 开发框架的演进路径——从混沌到标准化、从代码到声明式。Flue 的”Markdown 即逻辑”理念如果成立,将大幅降低 Agent 开发的编程门槛。
2. Agent 的”感官”和”记忆”同步进化:Agent-Reach 给 Agent 装上”眼睛”(互联网感知),MemPalace 给 Agent 装上”记忆”(逐字回忆),加上昨天的 Dreaming。Agent 的三大短板——感知、记忆、执行——前两者本周集中补课。
3. 端侧推理加速:QAT 成为新焦点:Google Gemma 4 QAT 和 Ollama GGUF 优化同步推进,量化感知训练取代训练后量化成为端侧部署的主流策略。这将加速 AI 从云端走向设备的进程。