站点图标 Linux-技术共享

卸载小龙虾,安装 Hermes

用小龙虾40多天,优化了记忆调整了 Skill,但是第40天和第1天没有太大区别!

一句话总结:小龙虾没有记忆,只有仓库!
用小龙虾这一个多月,我一直在试一件事:把它打造成我的贴身助理。喂它项目笔记、客户沟通、市场感悟,希望它能逐渐懂我,甚至拥有我的思维方式。
但说实话,这件事非常难。不是小龙虾不好用,是它从底层设计上就不是干这个的。所以我在看到 Hermes 以后果断卸载了小龙虾。本文只有0.1%的篇幅会介绍 Hermes 的安装与配置,会放在文后,在大 AI 时代所有的教程都是信息垃圾!


01. 为什么放弃小龙虾
当前市面上的 Agent 有一个共同的毛病:都在卷"存储"和"执行",没一个在卷"成长"。
小龙虾的模式是这样的:碎片信息存 MEMORY.md,SOUL.md 定义人格,Skill 按步骤执行。看起来很合理,但这些全是静态的。第 100 次对话和第 1 次,它对你的理解没有任何变化。你喂的数据只是躺在那,没转化。MEMORY.md 越写越长,但它不会自己提炼;SOUL.md 是你手写的,它不会自己进化;Skill 是你配的,它不会自己创造。
说白了,小龙虾是多 Agent 编排系统。组织 AI 协同工作它擅长,但"理解用户"这件事,天花板很低。这不是 bug,是这一代 Agent 的设计局限。
所以大家用小龙虾的常态就是自己本身工作也没想明白,工作流也梳理不出来,用来做信息记忆如果记忆体系没重构,最后要么记不住,要么越记越乱。所以小龙虾猝!


就我个人而言,我目的工作主要是:
1.运营推特写文章
2.Vibe 一些工具
3.要做一些交易
4.要运营传统业务财务、合同、技术等

这些事都是我一个在做,但是因为受限某些场景的特殊性没法完全托管,所以我现在的工作模式是 Cluade code 为主,Openclaw 为辅的架构。这也是为啥我一直喊大多数人养虾没用!
02. Hermes 凭啥打动我
Token 压缩、记忆的成长性。就这两点我就决定卸载小龙虾了!


一、记忆和Token
小龙虾在这块做得不好,对话一长 context 就膨胀,你能感觉到它越聊越慢越聊越贵,最后要么手动清上下文,要么接受效果打折。
Hermes 完全不是这个思路。它把记忆拆成四层,每层的加载时机和 Token 策略都不一样:
Prompt Memory 是常驻层。MEMORY.md + USER.md 直接注入系统提示,但卡了一个硬限制,总共 3,575 字符。不是随便设的,是刻意逼 Agent 做精炼而不是堆砌。还有个反直觉的设计:对话中改的记忆要到下一次会话才生效,防止临时信息把上下文污染了。
FTS5 Session Search 解决的是"历史怎么用"。每次对话存 SQLite,全文检索索引。Agent 需要的时候去搜,搜出来的结果经 LLM 摘要才注入不塞整段历史,只拿跟当前任务相关的内容。
Skills 层是程序性记忆。创新点在渐进式加载:默认只加载名称和摘要,完整内容按需调。这意味着 200 个 Skill 和 40 个 Skill 的 Token 成本几乎一样。
最上面是 Honcho,被动用户建模。Agent 在交互中自动追踪你的沟通风格、偏好、领域知识,通过方言式建模在 12 个身份层上持续进化。你不用写任何东西,它在观察你。
四层加在一起的效果:Agent 越用越聪明,Token 账单不会跟着涨。


二、能力比较
直接对比三个核心差异:
(1)闭环学习
小龙虾的 Skill 是你手动创建的,它不会自己学任何新东西。Hermes 不一样,当任务满足触发条件(5 次以上工具调用、错误恢复、用户纠正),Agent 会自动创建 Skill 文件,记录"这条路走通了,下次不用重新摸索"。这些 Skill 还会在使用中自我改进,用 patch 而非 rewrite 更新,只改变化的部分。这不是存储,是经验积累。
(2)Token压缩
小龙虾的压缩是粗暴的,要么丢要么全塞。Hermes 用辅助模型在 context 接近上限时触发压缩,提取关键内容到 3,575 字符限制内,中间轮次做摘要而非丢弃。关键是保留了 Lineage 链,压缩后可以追溯回原始对话,不是不可逆的信息丢失。
(3)Gateway一体化
小龙虾的 Gateway 只管消息投递,Skill 创建、记忆写入、定时任务走独立机制。Hermes 的 Gateway 是学习闭环的一部分:消息进来可以触发 Skill 创建,定时任务输出通过同一层路由回去。Telegram 开始的对话终端里继续,因为 Session 绑定 ID 不绑定平台。


03. 总结和教程
我 100% 确定,Hermes 一定不是最优解,但他是当前阶段最适合解决我的问题的 Agent!
所以啥是好 Agent?是能无缝和自己配合解决自己需求的贴身助理,不是热点,不是流量,不是人云亦云。Agent 好还是不好,一定是你弄懂了而不是别人说清了!
安装过程很简单,我直接让 Claude code 给我安装的,步骤是:
python
#给我安装 Hermes,并把在 openclaw 里面的所有配置迁移过来,包括但不限于和 Telegram 的配置、模型 API Key、Skill、记忆体系等等。
当然,如果你还没有用 Claude code,又想跟一下热度去装一下,那么步骤是:
python
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
安装好以后,使用 hermes setup 命令配置就可以


可是话说回来了,你都没把 Claude code 整明白,没有全面拥抱 AI,搞这些 Agent 的意义又在哪里?

我终于把 OpenClaw 换成 Hermes 了。
之前 OpenClaw 那层一直很尴尬:权限开得保守,也懒得走 API 付费,所以它长期只接简单模型,跑脚本、定时任务、Bot 之类的活。
时间一长,主工作台还是 Claude 和 Codex,OpenClaw 挂着利用率一直偏低。
这次换成 Hermes,原因很直接:
- 原生记忆栈更连贯,跨 session 不掉线
- 吃得上 Codex / Copilot 的订阅额度,多模型一个入口挂完
现在的分工也清楚了:
Claude / Codex 做主工作台,Hermes 接 mobile、TG、async execution 入口。
Claude memory 做 SSOT,单向同步给 Hermes。

看到"卸载小龙虾装 Hermes"这标题我以为又是追热度,读完发现作者认真对比过。
我之前也评估过 Hermes,不过没迁移。
香港CMIN2大宽带服务器,我们推荐 https://vmshell.com/ VmShell
换 agent 其实是算两笔账:
- 你现在卡点是记忆不够、执行不准、还是路由乱?
- 换过去能砍多少、迁移那几周要停摆多少?
作者文里那句"大家自己工作也没想明白"其实是整篇最重要的一句——换哪个 agent 都替你想不清楚。
换之前先回答这个问题。

退出移动版