太子进化论
下一阶段系统演进蓝图 · 2026-04-16
NOW — 本周内
Phase 0:打开双轨分流开关
从「单轨 fallback」正式切换为「双轨分流」,让 PyAgent 和 Kimi CLI 各尽其能

意图解析层

  • routing 输出增加 pyagent / kim_auto
  • _compute_routing() 按任务复杂度分流
  • 简单任务 → PyAgent(MiniMax)
  • 复杂任务 → Kimi CLI(--quiet)

执行层

  • step_llm_generate 按 routing 选工头
  • 工头A PyAgent:秒级响应、全自动
  • 工头B Kimi CLI:深度理解、5分钟超时
  • 不再混用 fallback,明确分流

验证目标

  • 从飞书发复杂需求,routing=kim_auto
  • Kimi CLI → Windows Agent → merge/deploy 跑通
  • 确认双轨制最后一块拼图就位
NEXT — 1 周内
Phase 1:Cockpit 诚实化 + 指挥台透明化
删掉许愿池,保留真实;指挥台输入后能看到太子在想什么、走到哪一步

态势感知

  • 每个卡片加诚实标签:[稳定] / [实验性] / [未接入]
  • 删掉写死的 demo 数据(如 +12% 假趋势)
  • 只显示真实可获取的指标

指挥台

  • 输入框上方加快捷意图条
  • 发送后显示意图解析确认卡片
  • 执行过程就地展开实时进度
  • 结果直接回写到对话流

侧边栏 & 按钮

  • 删掉「斐波那契」示例按钮
  • 每个按钮标注 [可用] / [未接入]
  • 垃圾按钮灰化或删除

记忆库

  • 标题从「语义搜索」改为「历史记录」
  • 右上角加 [实验性] 标签
  • 只做时间线过滤,不做 AI 召回
改造前
用户发完指令 → 黑盒等待 30 秒 → 弹出"指令已接收" → 不知道太子听懂了没有,也不知道任务在哪一步。
改造后
用户发完指令 → 2 秒内看到意图解析结果 → 确认后实时看到每步推进 → 结果直接回显在对话中。
PHASE 2 — 1~2 周
Phase 2:节点真实化
健康检查从「远程算命」变成「节点自治上报」

HK 节点

  • 部署 node-agent.py(FastAPI)
  • 暴露 GET /health
  • 返回 CPU/内存/磁盘/本机服务状态

Windows 节点

  • windk_agent.py 增加 GET /health
  • 返回进程状态 + windk 队列长度
  • Tailscale 内网 HTTP 可达

Mac 中枢

  • status.py 全部改 HTTP 拉取
  • 删掉 SSH inline 脚本(tasklist / psutil)
  • 3 秒超时,失败标记 unreachable

拓扑图

  • 默认显示三节点实时迷你仪表盘
  • 颜色由节点自己上报决定,不由 Mac 猜
改造前
Mac → SSH 执行 "python3 -c '...psutil...'" → HK
Mac → SSH 执行 "tasklist" → Windows
这叫远程算命,不是健康检查。
改造后
HK 自己说:我 CPU 15%、内存 40%、服务正常
Windows 自己说:我 Agent 运行中、队列长度 2
Mac 只负责拉取和展示,不替节点体检。
PHASE 3 — 2 周
Phase 3:执行白盒化
从「黑盒轮询」变成「事件流实时推送」

事件总线

  • 引入 Redis Pub/Sub(最小可用)
  • Worker 每完成一步 emit event
  • event 包含 step/status/provider/duration/output_snippet

前端

  • SSE (Server-Sent Events) 订阅事件流
  • 任务卡片变成实时步骤进度条
  • 可展开查看每步 stdout/详细日志
  • 删掉 setInterval(fetch, 8000) 轮询

用户体验

  • 指挥官看到任务像打字机一样推进
  • 失败步骤标红,可立即查看原因
  • 历史任务可回放完整执行过程
PHASE 4 — 2~3 周
Phase 4:产品模板化
从「斐波那契玩具」变成「行业可售卖单元」

模板接入

  • 光伏清洗排班 → prompt + schema + test
  • 渔船日志统计 → prompt + schema + test
  • 实验小鼠记录 → prompt + schema + test
  • 爆破工程日报 → prompt + schema + test

生成链路

  • 用户选模板 → 自动注入行业 PRD 上下文
  • LLM 生成符合该领域术语和规则的代码
  • 每个模板绑定专属 test-suite
  • 沙箱测试不通过 → 自动回炉重生成

商业化

  • 形成第一个 MVPU(最小可售卖单元)
  • 内部或种子客户真实交付
  • Cockpit 默认入口不再是聊天,而是模板选择器

架 构 师 诚 实 宣 言

真正的架构师不是画最多框的人,
而是敢删掉 80% 的功能、只留下真实可用的 20% 的人;
敢在投资人面前说「这个还没做好」的人;
敢让陌生人独立操作系统、不需要创始人在旁边传功的人。

如果做不到这三条,架构图画得越豪华,系统死得越快。