Version: 0.7.0.dev.260319

 feat(agent): 新增智能排程 Agent 全链路 + ReAct 精排引擎

  🏗️ 智能排程 Graph 编排(阶段 1 基础链路)
  - 新增 scheduleplan 包:state / tool / prompt / nodes / runner / graph 六件套
  - 实现 plan → preview → materialize → apply → reflect → finalize 完整图编排
  - 通过函数注入解耦 agent 层与 service 层,避免循环依赖
  - 路由层新增 schedule_plan 动作,复用现有 SSE + 持久化链路

  🧠 ReAct 精排引擎(阶段 1.5 语义化微调)
  - 粗排后构建"混合日程"(既有课程 + 建议任务),统一为 HybridScheduleEntry
  - LLM 开启深度思考,通过 Swap / Move / TimeAvailable / GetAvailableSlots 四个 Tool 在内存中优化任务时间
  - reasoning_content 实时流式推送前端,用户可见 AI 思考过程
  - 精排结果仅预览不落库,向后兼容(未注入依赖时走原有 materialize 路径)

  📝 文档
  - 新增 ReAct 精排引擎决策记录

  ⚠️ 已知问题:深度思考模式耗时较长,超时策略待优化
This commit is contained in:
Losita
2026-03-19 23:16:35 +08:00
parent cd95aeeaaa
commit d3cec2a5b9
24 changed files with 2737 additions and 24 deletions

View File

@@ -63,6 +63,33 @@
- 应对:严格 JSON Schema 校验,失败直接走默认修补/人工规则。
- 回滚:关闭 `ENABLE_SCHEDULE_PLAN_AGENT`,回退到原接口链路。
### 4.6 总流程规划
```
任务目标:实现一个基于 ReAct 范式的智能排程微调引擎,将“粗排结果”与“既有日程”混合,并通过 AI 进行语义化优化。
1.需要新建的前置函数:
(1)HybridScheduleWithPlan从数据库中提取和排程时间范围相同的日程放在sv/schedules.go里面通过回调来作为一个节点然后调用(如果你有更好的结构建议,欢迎告诉我)
2.需要新建的tool(直接改State)
(1)Swap:LLM传入带交换两个任务的相对时间(从json中获取第x周第x-x节),这个工具会自动寻找并交换时间(通过修改Schedule结构体内部数据实现的),找不到就报错。
(2)Move:同上,传入一个任务的相对时间(第x周第x-x节)直接寻找并修改State中的Schedule中的时间。
注意,上述(1)和(2)都必须带合法性检验。
(3)timeAvailable:检测目标时间在当前日程中是否可用,用于服务(2)。
(4)GetAvailableSlots:反馈给AI(json格式)可用时间的列表用于让AI选择挪动过去的时间。
3.基本流程如下:
(1)获取用户智能排程意图提取task_class_id调用SmartPlanning进行粗排然后再通过上面的前置函数(1)将日程和已经安排好的任务混合并传入State。
(2)LLM启动深度思考(必须开深度思考)告诉它上述工具及其作用让它自由选择调用。prompt你自己写差不多就是
考虑不同科目的"上下文切换成本"某科目更加适合学习的时间段以及人一天的学习效率曲线等因素修改上述json中status为suggested且type为task的任务最终形成无论从复习效果还是学习体感上来看都十分科学合理的学习方案。
(3)此时模型开启深度思考推送reasoning stream到前端和既定的状态chunk穿插。
(4)在思考中,模型一次看好改动逻辑(这就是为啥要开深度思考的原因,逻辑有点绕)然后思考结束出结果后一次性调用这些tool。
注意这里有备选方案如果模型逻辑不够那就一次只调一次tool多调用几次llm这样用时间换正确率。
(4.1)若调用成功,则直接返回排程结果到前端(禁止落库用户得看效果再决定是否正式落库而正式落库用不着agent)
(4.2)若失败则把失败原因返回LLMLLM再看情况自己思考并重试。
```
---
## 阶段 2从“我想复习概率论”自动生成任务类并接入阶段 1