卸载小龙虾,安装 Hermes

Linux网站管理员

5 小时前

用小龙虾40多天，优化了记忆调整了 Skill，但是第40天和第1天没有太大区别！

一句话总结：小龙虾没有记忆，只有仓库！
用小龙虾这一个多月，我一直在试一件事：把它打造成我的贴身助理。喂它项目笔记、客户沟通、市场感悟，希望它能逐渐懂我，甚至拥有我的思维方式。
但说实话，这件事非常难。不是小龙虾不好用，是它从底层设计上就不是干这个的。所以我在看到 Hermes 以后果断卸载了小龙虾。本文只有0.1%的篇幅会介绍 Hermes 的安装与配置，会放在文后，在大 AI 时代所有的教程都是信息垃圾！

01. 为什么放弃小龙虾
当前市面上的 Agent 有一个共同的毛病：都在卷"存储"和"执行"，没一个在卷"成长"。
小龙虾的模式是这样的：碎片信息存 MEMORY.md，SOUL.md 定义人格，Skill 按步骤执行。看起来很合理，但这些全是静态的。第 100 次对话和第 1 次，它对你的理解没有任何变化。你喂的数据只是躺在那，没转化。MEMORY.md 越写越长，但它不会自己提炼；SOUL.md 是你手写的，它不会自己进化；Skill 是你配的，它不会自己创造。
说白了，小龙虾是多 Agent 编排系统。组织 AI 协同工作它擅长，但"理解用户"这件事，天花板很低。这不是 bug，是这一代 Agent 的设计局限。
所以大家用小龙虾的常态就是自己本身工作也没想明白，工作流也梳理不出来，用来做信息记忆如果记忆体系没重构，最后要么记不住，要么越记越乱。所以小龙虾猝！

就我个人而言，我目的工作主要是：
1.运营推特写文章
2.Vibe 一些工具
3.要做一些交易
4.要运营传统业务财务、合同、技术等

这些事都是我一个在做，但是因为受限某些场景的特殊性没法完全托管，所以我现在的工作模式是 Cluade code 为主，Openclaw 为辅的架构。这也是为啥我一直喊大多数人养虾没用！
02. Hermes 凭啥打动我
Token 压缩、记忆的成长性。就这两点我就决定卸载小龙虾了！

一、记忆和Token
小龙虾在这块做得不好，对话一长 context 就膨胀，你能感觉到它越聊越慢越聊越贵，最后要么手动清上下文，要么接受效果打折。
Hermes 完全不是这个思路。它把记忆拆成四层，每层的加载时机和 Token 策略都不一样：
Prompt Memory 是常驻层。MEMORY.md + USER.md 直接注入系统提示，但卡了一个硬限制，总共 3,575 字符。不是随便设的，是刻意逼 Agent 做精炼而不是堆砌。还有个反直觉的设计：对话中改的记忆要到下一次会话才生效，防止临时信息把上下文污染了。
FTS5 Session Search 解决的是"历史怎么用"。每次对话存 SQLite，全文检索索引。Agent 需要的时候去搜，搜出来的结果经 LLM 摘要才注入不塞整段历史，只拿跟当前任务相关的内容。
Skills 层是程序性记忆。创新点在渐进式加载：默认只加载名称和摘要，完整内容按需调。这意味着 200 个 Skill 和 40 个 Skill 的 Token 成本几乎一样。
最上面是 Honcho，被动用户建模。Agent 在交互中自动追踪你的沟通风格、偏好、领域知识，通过方言式建模在 12 个身份层上持续进化。你不用写任何东西，它在观察你。
四层加在一起的效果：Agent 越用越聪明，Token 账单不会跟着涨。

二、能力比较
直接对比三个核心差异：
（1）闭环学习
小龙虾的 Skill 是你手动创建的，它不会自己学任何新东西。Hermes 不一样，当任务满足触发条件（5 次以上工具调用、错误恢复、用户纠正），Agent 会自动创建 Skill 文件，记录"这条路走通了，下次不用重新摸索"。这些 Skill 还会在使用中自我改进，用 patch 而非 rewrite 更新，只改变化的部分。这不是存储，是经验积累。
（2）Token压缩
小龙虾的压缩是粗暴的，要么丢要么全塞。Hermes 用辅助模型在 context 接近上限时触发压缩，提取关键内容到 3,575 字符限制内，中间轮次做摘要而非丢弃。关键是保留了 Lineage 链，压缩后可以追溯回原始对话，不是不可逆的信息丢失。
（3）Gateway一体化
小龙虾的 Gateway 只管消息投递，Skill 创建、记忆写入、定时任务走独立机制。Hermes 的 Gateway 是学习闭环的一部分：消息进来可以触发 Skill 创建，定时任务输出通过同一层路由回去。Telegram 开始的对话终端里继续，因为 Session 绑定 ID 不绑定平台。

03. 总结和教程
我 100% 确定，Hermes 一定不是最优解，但他是当前阶段最适合解决我的问题的 Agent！
所以啥是好 Agent？是能无缝和自己配合解决自己需求的贴身助理，不是热点，不是流量，不是人云亦云。Agent 好还是不好，一定是你弄懂了而不是别人说清了！
安装过程很简单，我直接让 Claude code 给我安装的，步骤是：
python
#给我安装 Hermes，并把在 openclaw 里面的所有配置迁移过来，包括但不限于和 Telegram 的配置、模型 API Key、Skill、记忆体系等等。
当然，如果你还没有用 Claude code，又想跟一下热度去装一下，那么步骤是：
python
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
安装好以后，使用 hermes setup 命令配置就可以

可是话说回来了，你都没把 Claude code 整明白，没有全面拥抱 AI，搞这些 Agent 的意义又在哪里？

我终于把 OpenClaw 换成 Hermes 了。
之前 OpenClaw 那层一直很尴尬：权限开得保守，也懒得走 API 付费，所以它长期只接简单模型，跑脚本、定时任务、Bot 之类的活。
时间一长，主工作台还是 Claude 和 Codex，OpenClaw 挂着利用率一直偏低。
这次换成 Hermes，原因很直接：
- 原生记忆栈更连贯，跨 session 不掉线
- 吃得上 Codex / Copilot 的订阅额度，多模型一个入口挂完
现在的分工也清楚了：
Claude / Codex 做主工作台，Hermes 接 mobile、TG、async execution 入口。
Claude memory 做 SSOT，单向同步给 Hermes。

看到"卸载小龙虾装 Hermes"这标题我以为又是追热度，读完发现作者认真对比过。
我之前也评估过 Hermes，不过没迁移。
香港CMIN2大宽带服务器，我们推荐 https://vmshell.com/ VmShell
换 agent 其实是算两笔账：
- 你现在卡点是记忆不够、执行不准、还是路由乱？
- 换过去能砍多少、迁移那几周要停摆多少？
作者文里那句"大家自己工作也没想明白"其实是整篇最重要的一句——换哪个 agent 都替你想不清楚。
换之前先回答这个问题。