Version: 0.7.1.dev.260321
feat(agent): ✨ 重构智能排程分流与双通道交付,补齐周级预算并接入连续微调复用 - 🔀 通用路由升级为 action 分流(chat/quick_note_create/task_query/schedule_plan),路由失败直接返回内部错误,不再回落聊天 - 🧭 智能排程链路重构:统一图编排与节点职责,完善日级/周级调优协作与提示词约束 - 📊 周级预算改为“有效周保底 + 负载加权分配”,避免有效周零预算并提升资源利用率 - ⚙️ 日级并发优化细化:按天拆分 DayGroup 并发执行,低收益天(suggested<=2)跳过,单天失败仅回退该天结果并继续全局 - 🧵 周级并发优化细化:按周并发 worker 执行,单周“单步动作”循环(每轮仅 1 个 Move/Swap 或 done),失败周保留原方案不影响其它周 - 🛰️ 新增排程预览双通道:聊天主链路输出终审文本,结构化 candidate_plans 通过 /api/v1/agent/schedule-preview 拉取 - 🗃️ 增补 Redis 预览缓存读写与清理逻辑,新增对应 API、路由、模型与错误码支持 - ♻️ 接入连续对话微调复用:命中同会话历史预览时复用上轮 HybridEntries,避免每轮重跑粗排 - 🛡️ 增加复用保护:仅当本轮与上轮 task_class_ids 集合一致才复用;不一致回退全量粗排 - 🧰 扩展预览缓存字段(task_class_ids/hybrid_entries/allocated_items),支撑微调承接链路 - 🗺️ 更新 README 5.4 Mermaid(总分流图 + 智能排程流转图)并补充决策文档 - ⚠️ 新增“连续微调复用”链路我尚未完成测试,且文档状态目前较为混乱,待连续对话微调功能真正测试完成后再统一更新
This commit is contained in:
@@ -1,3 +1,194 @@
|
||||
# 智能排程 Agent — ReAct 精排引擎 决策记录(2026-03-21 更新版)
|
||||
|
||||
## 0. 文档说明(先看这里)
|
||||
- 本文档分为两部分:
|
||||
1. **上半部分**:当前线上代码对应的“最终链路决策”(2026-03-21 版本)。
|
||||
2. **下半部分**:2026-03-19 的原始决策内容,**原样保留**作为发展历程。
|
||||
- 这样做的目的:
|
||||
1. 评审时先看“现在系统到底怎么跑”;
|
||||
2. 复盘时还能追踪“从旧方案到现方案”的演进路径。
|
||||
|
||||
## 1. 基本信息(当前版本)
|
||||
- 记录编号:FDR-008B
|
||||
- 功能名称:智能排程 ReAct 精排引擎(阶段 2:多任务类分流 + 日级并发 + 周级并发单步优化 + 双通道交付)
|
||||
- 记录日期:2026-03-21
|
||||
- 决策状态:已采纳,已落地
|
||||
- 负责人:SmartFlow 团队
|
||||
- 关联需求:FDR-008(初版)、FDR-007(智能排程 Agent 阶段 1)
|
||||
|
||||
## 2. 本轮最终决策(A->B 最终态)
|
||||
### 2.1 决策摘要
|
||||
- 决策 1:智能排程入口继续走统一 Agent 分流(`action=schedule_plan`),不新增独立聊天接口。
|
||||
- 决策 2:图内分流改为“**按 task_class_ids 长度**”:
|
||||
1. `len(task_class_ids) == 1`:跳过 `daily_split/daily_refine/merge`,直接周级优化;
|
||||
2. `len(task_class_ids) >= 2`:先日级并发优化,再周级并发优化。
|
||||
- 决策 3:周级优化改为“**单步动作模式**”(每轮只允许 1 个 `Move/Swap` 或 `done`)。
|
||||
- 决策 4:周级预算改为“双预算 + 每有效周保底 + 负载加权”:
|
||||
1. 总预算:成功/失败都扣;
|
||||
2. 有效预算:仅成功动作扣;
|
||||
3. 每个有效周至少 1 个总预算和 1 个有效预算;
|
||||
4. 额外预算按周负载加权分配。
|
||||
- 决策 5:输出采用双通道:
|
||||
1. SSE 主通道仅返回终审自然语言(`FinalSummary`);
|
||||
2. 结构化 `candidate_plans` 走 `/api/v1/agent/schedule-preview` 查询(Redis 快照)。
|
||||
|
||||
### 2.2 为什么这样改
|
||||
- 目标 1:把“单任务类”和“多任务类混排”拆开治理,减少无效模型调用。
|
||||
- 目标 2:把周级优化从“模型大段犹豫”改成“走一步看一步”,缩短长尾。
|
||||
- 目标 3:前端同时拿到“可读结论”和“结构化预览”,避免 SSE 里吐 JSON 影响体验。
|
||||
- 目标 4:预算治理可解释,避免某些有效周被分配为 0 导致“看起来没优化”。
|
||||
|
||||
## 3. 当前全链路(代码真实流程)
|
||||
### 3.1 Agent 总分流(与 schedule_plan 的关系)
|
||||
1. `POST /api/v1/agent/chat` 进入 `AgentService.AgentChat`。
|
||||
2. 先做会话存在性检查(Redis -> DB -> 必要时创建)。
|
||||
3. 调 `route.DecideActionRouting` 获取 action。
|
||||
4. 若 `RouteFailed=true`:直接返回内部错误(不再回落聊天)。
|
||||
5. 若 `action=schedule_plan`:进入 `runSchedulePlanFlow`。
|
||||
6. 若 `runSchedulePlanFlow` 报错:当前策略是记录日志 + 发 fallback 阶段块 + 回退普通聊天(可用性优先)。
|
||||
|
||||
### 3.2 schedule_plan 图编排(当前版本)
|
||||
```mermaid
|
||||
flowchart TD
|
||||
START([START]) --> plan["plan<br/>提取意图/约束/strategy/task_class_ids/task_tags"]
|
||||
plan --> p1{"FinalSummary 非空<br/>或 task_class_ids 为空?"}
|
||||
p1 -- "是" --> exit["exit -> END"]
|
||||
p1 -- "否" --> rough["rough_build<br/>HybridScheduleWithPlanMulti<br/>+ 可选 ResolvePlanningWindow"]
|
||||
|
||||
rough --> p2{"构建失败或 HybridEntries 为空?"}
|
||||
p2 -- "是" --> exit
|
||||
p2 -- "否" --> p3{"len(task_class_ids) >= 2 ?"}
|
||||
|
||||
p3 -- "是" --> split["daily_split<br/>按天拆组 + ContextTag 注入 + SkipRefine 标记"]
|
||||
split --> drefine["daily_refine(并发)<br/>单天 ReAct,失败回退原天"]
|
||||
drefine --> merge["merge<br/>合并结果,冲突回退"]
|
||||
merge --> wrefine["weekly_refine(并发按周)<br/>单步 Move/Swap + 双预算"]
|
||||
|
||||
p3 -- "否" --> wrefine
|
||||
wrefine --> final["final_check<br/>物理校验 + 总结生成"]
|
||||
final --> preview["return_preview<br/>回填 AllocatedItems + 产出 CandidatePlans"]
|
||||
preview --> END([END])
|
||||
```
|
||||
|
||||
## 4. 节点级职责边界(当前实现)
|
||||
### 4.1 `plan`
|
||||
1. 先合并 `extra.task_class_ids`(显式参数优先);
|
||||
2. 再用模型抽取 `intent/constraints/strategy/task_tags`;
|
||||
3. 模型失败但有 `task_class_ids` 时,使用参数兜底继续;
|
||||
4. 最终仍无任务类时,写入 `FinalSummary` 并提前退出。
|
||||
|
||||
### 4.2 `rough_build`
|
||||
1. 调 `HybridScheduleWithPlanMulti` 统一构建混合条目(existing + suggested);
|
||||
2. 生成 `CandidatePlans`(预览结构);
|
||||
3. 可选解析全局窗口边界(`PlanStartWeek/Day` ~ `PlanEndWeek/Day`),供周级 Move 硬校验;
|
||||
4. 失败时写 `FinalSummary` 并提前退出。
|
||||
|
||||
### 4.3 `daily_split`
|
||||
1. 按 `(week, day)` 拆成 `DayGroup`;
|
||||
2. 按 `task_item_id -> tag` 注入 `ContextTag`;
|
||||
3. `suggested <= 2` 标记 `SkipRefine=true`,减少低收益模型调用。
|
||||
|
||||
### 4.4 `daily_refine`(并发)
|
||||
1. 按天并发执行单天 ReAct;
|
||||
2. 单天失败只回退该天,不拖垮全局;
|
||||
3. 发“day_start/day_done”阶段块,并携带进度;
|
||||
4. Thinking 默认关闭(降低并发阶段长尾)。
|
||||
|
||||
### 4.5 `merge`
|
||||
1. 合并 `DailyResults`;
|
||||
2. 做冲突校验(同一 `(week,day,section)` 不能被阻塞条目重复占用);
|
||||
3. 有冲突则整体回退到 merge 前快照;
|
||||
4. 产出 `MergeSnapshot`,供 `final_check` 二次回退。
|
||||
|
||||
### 4.6 `weekly_refine`(并发按周 + 单步动作)
|
||||
1. 先按周拆数据,仅对“有 suggested 的周”分配预算;
|
||||
2. 强制每个有效周至少 1 总预算 + 1 有效预算;
|
||||
3. 剩余预算按周负载加权分配;
|
||||
4. 单周 worker 循环:
|
||||
1. 每轮仅 1 个工具调用(`Move/Swap`)或 `done`;
|
||||
2. 总预算:调用即扣;
|
||||
3. 有效预算:成功才扣;
|
||||
4. Move 必须留在 worker 当前周,且受全局窗口 day 边界约束;
|
||||
5. 工具结果回灌到下一轮上下文,形成“走一步看一步”。
|
||||
|
||||
### 4.7 `final_check`
|
||||
1. 物理校验三项:
|
||||
1. 时间冲突;
|
||||
2. 节次越界;
|
||||
3. suggested 数量与 `AllocatedItems` 数量一致性。
|
||||
2. 校验失败时回退 `MergeSnapshot`;
|
||||
3. 再由模型生成 2-3 句最终总结(thinking 关闭)。
|
||||
|
||||
### 4.8 `return_preview`
|
||||
1. 把 `HybridEntries` 中 suggested 的最终位置回填到 `AllocatedItems`;
|
||||
2. 转换为 `CandidatePlans`;
|
||||
3. 若 `FinalSummary` 为空则兜底填充;
|
||||
4. 仅返回预览,不直接落库。
|
||||
|
||||
## 5. 工具与约束(当前版本)
|
||||
### 5.1 工具集合
|
||||
1. `Swap`:交换两个 suggested 任务时间;
|
||||
2. `Move`:移动一个 suggested 任务到新时间;
|
||||
3. `TimeAvailable`:检查时间段可用性;
|
||||
4. `GetAvailableSlots`:列出可用槽位。
|
||||
|
||||
### 5.2 周级单步模式硬约束
|
||||
1. 仅允许 `Move/Swap`;
|
||||
2. 不允许跨 worker 周移动;
|
||||
3. 若启用全局窗口,`Move` 必须落在窗口允许的 day 区间;
|
||||
4. 失败返回工具失败结果,不抛异常中断整周。
|
||||
|
||||
## 6. 输出协议与接口契约(当前版本)
|
||||
### 6.1 SSE 主通道
|
||||
1. 阶段块(伪装 reasoning chunk)用于进度反馈;
|
||||
2. 最终正文为 `FinalSummary`(不再吐 JSON);
|
||||
3. 结束块遵循 OpenAI 兼容流式格式。
|
||||
|
||||
### 6.2 结构化预览通道
|
||||
1. 排程结束后把快照写 Redis(`user_id + conversation_id` 作用域);
|
||||
2. 查询接口:`GET /api/v1/agent/schedule-preview?conversation_id=...`;
|
||||
3. 未命中返回业务错误码(预览不存在/过期);
|
||||
4. 写预览失败只记日志,不阻塞聊天主链路。
|
||||
|
||||
## 7. 失败策略与回退策略(当前版本)
|
||||
1. 路由控制码失败:直接报内部错误(不回落 chat)。
|
||||
2. schedule_plan 分支内部失败:上层当前策略仍回落普通聊天(可用性优先)。
|
||||
3. daily 单天失败:回退该天原方案。
|
||||
4. merge 冲突:回退 merge 前快照。
|
||||
5. final_check 失败:回退 `MergeSnapshot`。
|
||||
6. 预览缓存写失败:仅影响结构化查询,不影响 SSE 文本回复。
|
||||
|
||||
## 8. 影响范围(当前版本)
|
||||
### 8.1 主要模块
|
||||
1. `backend/agent/scheduleplan/*`(图编排、日级并发、周级并发、工具、预算、终审)
|
||||
2. `backend/service/agentsvc/agent_schedule_plan.go`(服务层接入 graph)
|
||||
3. `backend/service/agentsvc/agent_schedule_preview.go`(预览缓存读写)
|
||||
4. `backend/dao/agent-cache.go`(预览 Redis DAO)
|
||||
5. `backend/api/agent.go` + `backend/routers/routers.go`(预览查询接口)
|
||||
6. `backend/agent/route/route.go`(统一 action 分流)
|
||||
|
||||
### 8.2 数据与存储
|
||||
1. 主排程流程不直接写最终排程库;
|
||||
2. 新增 Redis 预览快照读写;
|
||||
3. 聊天消息仍走统一后置持久化(Redis + outbox/DB)。
|
||||
|
||||
## 9. 验证与回滚(当前版本)
|
||||
### 9.1 验证要点
|
||||
1. `task_class_ids=1` 时应跳过日级并发,直接周级优化;
|
||||
2. `task_class_ids>=2` 时应进入日级并发 + merge + 周级并发;
|
||||
3. SSE 正文应是自然语言,不应出现粗排 JSON;
|
||||
4. `/agent/schedule-preview` 能按 `conversation_id` 读到 `candidate_plans`;
|
||||
5. 预算日志应能解释每周预算分配和消耗。
|
||||
|
||||
### 9.2 回滚策略
|
||||
1. 软回滚:关闭 schedule_plan 路由命中(临时回落聊天解释);
|
||||
2. 逻辑回滚:周级并发退回单线程或关掉 daily_refine;
|
||||
3. 通道回滚:保留 SSE 文本,临时下线 `schedule-preview` 查询。
|
||||
|
||||
---
|
||||
|
||||
## 附录 A:2026-03-19 原始内容(原文保留,作为发展历程)
|
||||
|
||||
# 智能排程 Agent — ReAct 精排引擎 决策记录
|
||||
|
||||
## 1. 基本信息
|
||||
|
||||
Reference in New Issue
Block a user