| Soul | 角色 | 职责域 |
|---|---|---|
| 🀄 红中 | 调度秘书 | 任务拆解、子任务编排 |
| 🀆 白板 | 审计员 | 方案审核、合规检查 |
| 🀅 发财 | 学习员 | 阅读、知识入库、蒸馏 |
| 🉐 东风 | 制作人 | 游戏业务、功能开发 |
| 🀀 南风 | 架构师 | 系统设计、接口定义 |
| 🀁 西风 | 代码审查 | 安全审计、代码质量 |
| 🀂 北风 | 测试员 | 测试用例、回归验证 |
子 Soul 把"写文件"当成自己的活,东风连续 4 次超时。
解决:铁律——子 Soul 发现自己在"准备写",立刻停,改调 claude --print 让 Agent 写。子 Soul 只管调度,不碰代码。
Agent 说了 "let me create" 就结束,没有真正写文件。
解决:claude --print --permission-mode bypassPermissions 同步阻塞调用,跑完才返回。
任务归档了但 cron 没停,不断产生告警。
解决:所有 cron 关闭统一走 end-task.py,禁止 Soul 内联 disable。
白板准奏后没有触发执行 Soul,任务卡在 planning。
解决:红中 → 白板 → 红中2号 → 执行 Soul,每段用 cron 自动触发,不依赖 Soul 间直接通信。
基于异步邮件总线(bus/inbox),不依赖实时连接。任务通过 cron 自动触发流转,设备离线不影响其他设备。骰子6号在 Will 睡觉时依然自动巡检、写日记、备份。
每个 Agent 只注入完成当前任务所需的最少信息。不读无关文件、不看其他任务的进度。Prompt 里只有:任务 brief + 可用 Skill 路径 + 铁律速查(3 条)。
三层架构 + 七个专业 Soul。每个 Soul 只处理自己职能域的任务,不越界。一个 Soul 实例只负责一个任务。Agent 用麻将牌池命名,全局可追溯。
人类只在两个节点介入:下达任务和审核产出。中间的拆解、审核、执行、监控、蒸馏全部自动化。任务从创建到归档,有完整的生命周期管理。
| 环节 | 职责 | 当前实现 | 可替换为 |
|---|---|---|---|
| 路由层 | 判断意图、任务分类 | OpenClaw 骰子 | 任何能接收消息的 gateway / webhook |
| 编排层 | 拆解任务、审核、调度 | 红中 + 白板(Soul session) | LangGraph / CrewAI / 自写脚本 |
| 执行层 | 写代码、读文档、调 API | claude --print(Claude Code CLI) | Cursor CLI / Aider / Codex / 任何 coding agent |
| 知识层 | 记忆存储、经验检索 | Git + Markdown + FTS | 向量数据库 / RAG 系统 / 任何存储 |
当前行业的主流思路是"让 AI 适配现有开发流程"——给 AI 已有的架构文档、策划文档,让它按照人的路线写代码。这本质上是在维护一个中间产物,是自讨苦吃。
既然选择使用 AI,就要信任 AI。
AI 调参本身就是一个"随机概率 × 用户喜好随机概率"的组合实验,行业一直在做,从未停过。
但如果把龙虾这条"AI 编排 → 自动产出"的链路打通,影响的就不只是调参了——原来 5 万量级的调参可以扩充到 50 万,投放成本忽略不计,因为产出成本极低。
然而,调参的性价比终究有限。真正的杠杆在功能级别的变化——AI 不只是调参数,而是创造新功能、新玩法。这才是 AI 编排系统的终极价值:不是做得更便宜,而是做出人力成本下根本不会去做的东西。
AB 测试的本质是创意发散 + 严谨验证的循环。人和 AI 各有天然优势,组合起来才是最优解。