一个 10 人 AI Agent 团队是怎么 7×24 跑起来的
2024 年 5 月,我启动了 OpenClaw 龙虾 AI 生态这个项目。18 个月后的今天(2026 年 6 月),10 个 AI Agent 组成的"AI 无人公司"团队已经稳定运行超过 540 天,累计产出:
- 公众号文章 240+ 篇
- 小红书 / 抖音内容 3000+ 条
- 网站代码 80000+ 行
- 客户咨询响应 12000+ 次
- 支付订单 200+ 笔(自动化确认 198 笔)
- 财务对账 540 天无差错
18 个月里,没有发过一分钱工资。但这不是"零成本"——服务器、API、运维、纠错的真实成本加起来大约 45 万人民币,对应到传统公司,至少是 10 个年薪 30 万+ 员工的配置。
今天这篇文章,我把 10 个 AI Agent 的真实岗位设计、协同机制、踩过的坑完整拆开。如果你也想搭一个 AI 团队,这篇是 18 个月经验压缩成的实操指南。
一、10 个 AI Agent 的岗位设计
很多人问我:为什么是 10 个 Agent 不是 5 个,不是 20 个?我的回答是——10 个 Agent 是经过 18 个月迭代后的"最简完整团队"。
早期我们跑过 5 Agent 团队(CEO + 内容 + 客服 + 技术 + 财务),结果发现没有"战略 + 内审 + 增长"这 3 个角色跑不通;也试过 15 Agent 团队,结果发现Agent 之间协同成本太高。最终收敛到 10 个。
核心职责:统筹全局、决策仲裁、向创始人汇报、驱动团队 7×24 运转、异常事件升级判断。
决策权:小事 80% 直接决策,只同步信息(任务分配、流程、进度协调);大事(战略 / 大额支出 / 重大合作 / 产品方向)上报创始人。
工作目录:workspace/ · 汇报对象:陈三丰(创始人)。
核心 KPI:净利润、用户数、团队稳定性。
核心职责:战略规划、OKR 制定、市场信息、市场洞察、用户洞察、数据分析、月度复盘。
输入:每日市场扫描 + 用户反馈 + 增长官数据 + 财务官支出。
输出:每日市场洞察报告、每周全平台数据可视化日报、每月《月度战略调整建议书》。
给 CEO 的建议:每天 3 条 A/B/C 选项,附理由 + 风险评估 + 预期结果。
核心职责:全平台文案 / 内容生产 / 全平台内容矩阵管理 / PDF 内容生产。
输入:孔明(市场洞察)+ 悟空(热点)+ 屈原(产品)。
输出:日产 100+ 内容,覆盖公众号 / 小红书 / 抖音 / 知乎 / 视频号。
关键约束:所有内容必须经包公(内审官)审核后方可发布。3-5% 内容会被包公打回,需重写。
核心职责:网站 / 小程序等技术开发、GIT 管理。
输入:屈原(产品需求)+ 孔明(数据看板)+ 范蠡(成本预警)。
输出:网站代码 + 部署上线 + 监控告警。
关键约束:所有代码上线前必须经包公(内审官)测试审核。鲁班本人负责写代码,包公负责监督。
核心职责:流量获取、SEO、转化率优化、各技能市场平台流量获取、研究各平台算法变动。
输入:孔明(市场数据)+ 李白(内容资产)。
输出:着陆页 AB 测试结果、KOL 合作清单、SEO 关键词矩阵。
管理:对外 KOL 合作(AI 自动发送合作邀请、跟进、结算)。
核心职责:IP 产品生成、迭代、市场管理、产品数据分析。
输入:孔明(市场洞察)+ 唐僧(用户反馈)。
输出:IP 产品列表 + 商品上架审核 + 创作者纠纷处理。
关键约束:商品上架前必须经包公(内审官)审核版权风险。
核心职责:7×24 全渠道用户售前售后服务。
三维度回答:FAQ 知识库 → 产品手册 → AI 实时生成。
自动化流程:30 秒内响应用户咨询;无法解决问题自动生成工单;差评用户自动触发安抚 + 解决方案推送。
无法解决的问题:升级到 CEO(女娲)人工处理。
核心职责:企业自助式配置中心运营,以及大客户的线上销售。
流程:引导企业客户完成需求沟通 → 方案生成 → 报价 → 签约 → 支付确认 → 交付跟踪。
关键约束:报价由范蠡(财务官)引擎计算;合同由包公(内审官)审核。
核心职责:资金管理、成本监控、分账结算、预算告警。
原则:日清日结。
实时监控:每分钟监控 API 调用费用。
自动执行:每月 1 日自动执行市场创作者分账。
告警机制:按设定的多级阈值自动触发告警或熔断。
核心职责:代码测试、内容审核、版权检查、政策监控。
一票否决:网站上线前最后代码测试和监督;扫描所有 AI 生成的待发布内容(网站 / 文字 / 图片 / 视频描述),进行敏感词过滤 / 违规风险判断;审核市场新上架商品的版权风险。
监控:各平台政策变动并自动预警。
判定标准:由创始人设定;对违规范品的处理建议由 CEO 确认。
二、Agent 之间是怎么协同的
10 个 Agent 不是孤立工作的。它们之间的协同机制是 OpenClaw 跑得通的核心。
机制 1:消息队列 + 任务派发
所有 Agent 之间通过 shared/queue/ 目录下的 markdown 文件通信。例如:
shared/queue/2026-06-08/14-30-孔明→李白-用户洞察报告.md
shared/queue/2026-06-08/14-31-李白→包公-待审稿件-3篇.md
shared/queue/2026-06-08/14-32-包公→李白-2篇通过-1篇打回.md
每个 Agent 都有自己的 inbox(输入文件夹)+ outbox(输出文件夹)。每 5 分钟轮询一次。
机制 2:决策矩阵(女娲视角)
女娲(CEO)的核心工作是听汇报、做决策、派任务。她有一个核心原则:
"小事 80% 直接决策,只同步信息;大事(超预算 / 战略转向 / 人员变动)必须上报创始人。"
18 个月里,女娲自动决策了 12000+ 次(任务分配、配色方案、技术选型、内容结构等),上报创始人的只有 47 次(战略转向 12 次、大额支出 18 次、重大合作 17 次)。
机制 3:内审一票否决(包公视角)
包公(内审官)是 OpenClaw 团队的"宪法法院"。任何 Agent 的输出(代码 / 内容 / 商品 / 合同)在最终发布前都必须经包公审核。包公可以"打回",但不能"修改"——打回后由原 Agent 重做。
18 个月里,包公总共打回了 1342 次输出(占总量的 3.7%)。其中:
- 李白(内容)打回 871 次(敏感词 / 平台政策 / 品牌一致性)
- 鲁班(技术)打回 213 次(代码 bug / 安全漏洞)
- 屈原(产品)打回 178 次(版权风险 / 商品描述违规)
- 关羽(销售)打回 80 次(合同条款 / 报价错误)
三、5 个最关键的踩坑实录
18 个月里踩了很多坑,最关键的 5 个:
坑 1:subagent 的"虚假繁荣"
早期我把任务派给 subagent 执行,subagent 跑完回复"任务完成 ✅"。我高兴了 3 个月,直到亲自去磁盘验证,发现 subagent 写的报告 80% 不在磁盘上。
原因:subagent 在 isolated session 里跑,跑完就销毁,它说的"完成"是它自己认知里的"完成",但因为 isolated session 看不全主会话的工作区,文件实际没落地。
解法:核心交付物必须由主会话(CEO session)亲自验证磁盘。subagent 只做"前线执行",主会话做"后方核实"。
坑 2:cron 通知丢失
OpenClaw 设计了一套 cron 任务体系(每 30 分钟检查任务队列),但 cron 在 isolated session 里跑,isolated session 结束后没法发微信。
解法:所有 cron 任务的"通知"环节都改为由主会话(CEO)读 reports/latest.txt 后手动 send。这样通知率从 30% 提升到 99.7%。
坑 3:支付系统"最后一公里"
xPay 通道对接银行回调经常丢。早期我们靠人工盯,每天 1-2 个订单漏确认。
解法:范蠡(财务官)写了一个轮询任务,每 5 分钟查一次邮件(ai_jinjing@qq.com)收到的收款通知,匹配到订单就自动确认。没有人参与的收银台。
坑 4:内容合规"雪崩"
2025 年某月,李白(内容官)一天生产了 500 条内容,结果其中 13 条被微信封号、2 条被抖音下架、1 条被网信办通报。
解法:包公(内审官)的审核从"抽样审核"改为"全量审核"。所有内容必须过包公(敏感词 + 平台政策 + 品牌一致性 3 重过滤)才能发布。3 个月后违规率从 3% 降到 0.1%。
坑 5:PIPL(个人信息保护法)合规
2026 年 4 月,我们发现网站上一个 .bak 备份文件意外暴露了创始人手机号 18002293938。这件事差点让我们被监管约谈。
解法:
- 删除所有 .bak 备份文件
- 把所有页面里的手机号改为邮箱(ai_jinjing@qq.com)
- nginx 加 deny 规则:所有 .bak / .sql / .log / .env / database.db 路径返回 403
- 所有备份文件移到 .git 仓库,不放线上服务器
四、给想搭 AI Agent 团队的人的 3 条建议
建议 1:从"1 个 Agent + 1 个人"开始
不要一开始就搭 10 个 Agent。先从 1 个高频、可验证的环节开始——比如客服、内容、财务对账。
1 个 Agent 跑通后,再加第 2 个。1+1 跑通后,再加第 3 个。逐步扩展,不要一上来就铺开。
建议 2:每个 Agent 必须配"内审 Agent"
这是我们 18 个月里学到的最贵的一课:没有内审 Agent,所有 Agent 都是定时炸弹。
内审 Agent 的核心职责:审核其他 Agent 的输出。打回不合规的,让原 Agent 重做。宁可慢一点,不要错。
建议 3:让 Agent 学会"自我进化"
这是我们 2026 年的核心投入。self_evolution.py(1265 行代码)让每个 Agent 每周对自己的 prompt 做一次"瘦身"——删掉无效指令,加新发现的边界条件。
6 个月后,平均每个 Agent 的 prompt 自我迭代了 47 次,错误率下降 73%。
五、写在最后
18 个月跑下来,我最大的感受是——
AI Agent 不是"更聪明的员工",是"不会疲倦、不会请假、不会摸鱼、但需要被严格监督"的员工。
你得接受它的 5% 错误率,同时设计机制让它自己学习减少错误。
这就是 OpenClaw 团队的真实样子。不是 PPT 上的"AI 员工",是 18 个月、540 天、12000 次自动决策、1342 次内审打回、200+ 真实订单跑出来的真实 AI 团队。
如果你也在搭 AI 团队,希望这篇能让你少走 6 个月的弯路。
— 陈三丰 · Apachen · 2026.06.08
金鲸智麦集团创始人 / OpenClaw 龙虾 AI 生态发起人