Version: 0.7.5.dev.260324

🐛 fix(agent/schedulerefine): 修复复合微调分支链路问题,并将 MinContextSwitch 重构为固定坑位重排语义

- 🔧 修复 `schedulerefine` 复合路由中参数透传不完整、缺少 deterministic objective 时错误降级,以及“复合工具执行成功”与“终审通过”语义混淆的问题
-  保证新的独立复合分支能够正确执行、正确出站,并统一交由 `hard_check` 裁决最终结果
- 🔍 排查时发现 `MinContextSwitch` 上游 `context_tag` 存在整体退化为 `General` 的风险,影响MinContextSwitch
- 🛡️ 为 `MinContextSwitch` 增加兜底策略:当标签整体退化时,按任务名关键词推断学科分组,避免分组能力失效
- ♻️ 将 `MinContextSwitch` 从“整周重新寻找新坑位”调整为“坑位不变,任务顺序改变”
- 🎯 将落地方式从顺序 `BatchMove` 改为固定坑位原子重写,避免出现远距离跳位、跨天错迁、异常嵌入课位及循环换位冲突
- 🧹 修复 `hard_check` 在 `MinContextSwitch` 成功后仍执行 `origin_rank` 顺序归位、并导致逆序终审误判的问题
- 🚦 命中该分支后跳过顺序归位与顺序硬校验,避免 `summary` / `hard_check` 将有效重排结果误判为失败

📈 当前连续微调规划涉及的全部功能已可以稳定运行;下一步将继续扩展能力边界,并进一步优化 `schedule_plan` 流程

♻️ refactor: 重整 agent2 架构,并迁移 quicknote/chat 新链路,目前还剩3个模块未迁移,后续迁移完成后会删除原agent并将此目录命名为agent

- 🏗️ 明确 `agent2` 采用“统一分层目录 + 文件分层 + 依赖注入”的重构方案,不再沿用模块目录多层嵌套结构
- 🧩 完善 `agent2` 基础骨架,统一收口 `entrance` / `router` / `llm` / `stream` / `shared` / `model` / `prompt` / `node` / `graph` 等层级职责
- 🚚 将通用路由能力迁移至 `agent2/router`,沉淀统一的 `Action`、`RoutingDecision`、控制码解析,以及 `Dispatcher` / `Resolver` 抽象
- 💬 将普通聊天链路迁移至 `agent2/chat`,复用 `stream` 的 OpenAI 兼容输出协议与 LLM usage 聚合能力
- 📝 将 `quicknote` 链路迁移到 `agent2` 新结构,拆分为 `model` / `prompt` / `llm` / `node` / `graph` 多层实现,替换对旧 `agent/quicknote` 的直接依赖
- 🔌 调整 `agentsvc` 对 `agent2` 的引用,普通聊天、通用分流与 `quicknote` 全部切换到新链路
- ✂️ 去除 graph 内部 `runner` 转接层,改为由 node 层直接持有请求级依赖,并向 graph 暴露节点方法
- 🧹 合并 `graph/quicknote` 与 `graph/quicknote_run`,删除冗余骨架文件,收敛为单一 `quicknote graph` 文件
- 📚 新增 `agent2`《通用能力接入文档》,明确公共能力边界、接入方式以及 graph/node 协作约定
- 📝 更新 `AGENTS.md`,要求后续扩展 `agent2` 通用能力时必须同步维护接入文档

♻️ refactor: 删除了现Agent目录内Chat模块的两条冗余Prompt
This commit is contained in:
LoveLosita
2026-03-24 21:35:22 +08:00
parent e6941f98f2
commit f4ef6fb256
55 changed files with 5492 additions and 235 deletions

View File

@@ -300,7 +300,17 @@ func runCompositeRouteNode(
continue
}
lastReason = "未启用确定性目标,无法在复合路由直接收口"
// 1. “均匀分散/最少上下文切换”这类复合目标,未必能编译成 deterministic objective
// 2. 只要本轮要求的复合工具已经成功执行,就允许独立复合分支直接出站并跳过 ReAct
// 3. 最终是否真正达标,继续交给 hard_check 统一裁决,避免“工具成功却被路由误判失败”。
if reason, ok := allowCompositeRouteExitByToolSuccess(st, result); ok {
st.CompositeRouteSucceeded = true
emitStage("schedule_refine.route.handoff", truncate(reason, 180))
st.ActionLogs = append(st.ActionLogs, fmt.Sprintf("复合路由直接出站tool=%sreason=%s", required, reason))
return st, nil
}
lastReason = "未启用确定性目标,且复合工具门禁未满足,无法在复合路由直接出站"
}
// 1. 复合路由重试后仍失败,切入 ReAct 兜底并强制禁用复合工具。
@@ -343,6 +353,30 @@ func buildCompositeRouteTaskIDs(st *ScheduleRefineState) []int {
return out
}
// allowCompositeRouteExitByToolSuccess 判断“复合工具成功后,是否允许跳过 ReAct 直接进入终审”。
//
// 步骤化说明:
// 1. 仅在当前没有 deterministic objective 时启用,避免覆盖原有“确定性验收优先”策略;
// 2. 只有本轮要求的复合工具已成功、且成功工具名与门禁一致时才放行;
// 3. 放行后并不代表最终成功,后续仍由 hard_check 做统一裁决。
func allowCompositeRouteExitByToolSuccess(st *ScheduleRefineState, result reactToolResult) (string, bool) {
if st == nil || !result.Success {
return "", false
}
if strings.TrimSpace(st.Objective.Mode) != "" && strings.TrimSpace(st.Objective.Mode) != "none" {
return "", false
}
required := normalizeCompositeToolName(st.RequiredCompositeTool)
toolName := normalizeCompositeToolName(result.Tool)
if required == "" || toolName == "" || required != toolName {
return "", false
}
if !isRequiredCompositeSatisfied(st) {
return "", false
}
return fmt.Sprintf("复合工具 %s 已成功执行;当前目标暂不支持确定性收口,跳过 ReAct交由终审裁决。", required), true
}
func buildCompositeRouteCall(st *ScheduleRefineState, tool string, taskIDs []int) reactToolCall {
limit := len(taskIDs) * 6
if limit < 12 {
@@ -729,7 +763,9 @@ func runHardCheckNode(
// 2. 后续顺序归位仅用于最终展示与顺序一致性,不得反向改变业务目标成败。
intentPassLocked, intentReasonLocked, intentUnmetLocked := evaluateIntentForJudgement(ctx, chatModel, st, emitStage)
emitStage("schedule_refine.hard_check.intent_locked", fmt.Sprintf("终审业务目标已锁定pass=%treason=%s", intentPassLocked, truncate(intentReasonLocked, 120)))
if changed := normalizeMovableTaskOrderByOrigin(st); changed {
if changed, skipped := tryNormalizeMovableTaskOrderByOrigin(st); skipped {
emitStage("schedule_refine.hard_check.order_normalized", "已跳过顺序归位MinContextSwitch 结果需要保留重排后的任务顺序。")
} else if changed {
emitStage("schedule_refine.hard_check.order_normalized", "已在终审前按 origin_rank 对坑位做顺序归位。")
}
report := evaluateHardChecks(ctx, chatModel, st, emitStage)
@@ -754,7 +790,9 @@ func runHardCheckNode(
}
intentPassLocked, intentReasonLocked, intentUnmetLocked = evaluateIntentForJudgement(ctx, chatModel, st, emitStage)
emitStage("schedule_refine.hard_check.intent_locked", fmt.Sprintf("修复后业务目标已锁定pass=%treason=%s", intentPassLocked, truncate(intentReasonLocked, 120)))
if changed := normalizeMovableTaskOrderByOrigin(st); changed {
if changed, skipped := tryNormalizeMovableTaskOrderByOrigin(st); skipped {
emitStage("schedule_refine.hard_check.order_normalized", "修复后跳过顺序归位MinContextSwitch 结果需要保留重排后的任务顺序。")
} else if changed {
emitStage("schedule_refine.hard_check.order_normalized", "修复后已按 origin_rank 对坑位做顺序归位。")
}
report = evaluateHardChecks(ctx, chatModel, st, emitStage)
@@ -795,7 +833,7 @@ func runSummaryNode(
emitModelRawDebug(emitStage, "summary", raw)
}
if err != nil || summary == "" {
if st.HardCheck.PhysicsPassed && st.HardCheck.OrderPassed && st.HardCheck.IntentPassed {
if FinalHardCheckPassed(st) {
summary = fmt.Sprintf("微调已完成,共执行 %d 轮动作,方案已通过终审。", st.RoundUsed)
} else {
summary = fmt.Sprintf("已完成微调并返回当前最优结果(执行 %d 轮动作)。终审仍有未满足项:%s。", st.RoundUsed, fallbackText(st.HardCheck.IntentReason, "请进一步明确微调目标"))
@@ -803,7 +841,10 @@ func runSummaryNode(
}
summary = alignSummaryWithHardCheck(st, summary)
st.FinalSummary = summary
st.Completed = true
// 1. Completed 只代表“最终终审已通过”,不再把“链路执行完毕”误写成成功;
// 2. 这样外层持久化与展示层可以准确区分“已通过方案”与“当前最优但未达标方案”;
// 3. 若只是返回 best-effort 结果FinalSummary 仍会保留,但 Completed=false。
st.Completed = FinalHardCheckPassed(st)
emitStage("schedule_refine.summary.done", "微调总结已生成。")
return st, nil
}
@@ -813,8 +854,9 @@ func evaluateHardChecks(ctx context.Context, chatModel *ark.ChatModel, st *Sched
report.PhysicsIssues = physicsCheck(st.HybridEntries, len(st.AllocatedItems))
report.PhysicsPassed = len(report.PhysicsIssues) == 0
// 1. 顺序校验默认开启:即便执行期放开顺序限制,终审也要验证“后端归位”后的顺序正确性。
// 2. 当 origin_order_map 为空时降级跳过,避免无基线时误报
needOrderCheck := len(st.OriginOrderMap) > 0
// 2. 但 MinContextSwitch 成功后,重排后的顺序本身就是业务目标,不能再拿 origin_rank 反向判错
// 3. 当 origin_order_map 为空时同样降级跳过,避免无基线时误报。
needOrderCheck := len(st.OriginOrderMap) > 0 && !shouldSkipOrderConstraintCheck(st)
report.OrderIssues = validateRelativeOrder(st.HybridEntries, refineToolPolicy{
KeepRelativeOrder: needOrderCheck,
OrderScope: st.Contract.OrderScope,
@@ -1305,6 +1347,34 @@ func normalizeMovableTaskOrderByOrigin(st *ScheduleRefineState) bool {
return true
}
// tryNormalizeMovableTaskOrderByOrigin 决定是否执行“按 origin_rank 顺序归位”。
//
// 步骤化说明:
// 1. 默认仍保持旧行为,继续在终审前做展示侧顺序归位;
// 2. 但当 MinContextSwitch 已成功执行时,重排后的顺序本身就是业务目标的一部分;
// 3. 此时若再按 origin_rank 归位,会把复合工具效果直接抹掉,因此必须跳过。
func tryNormalizeMovableTaskOrderByOrigin(st *ScheduleRefineState) (changed bool, skipped bool) {
if shouldSkipOriginOrderNormalization(st) {
return false, true
}
return normalizeMovableTaskOrderByOrigin(st), false
}
func shouldSkipOriginOrderNormalization(st *ScheduleRefineState) bool {
if st == nil {
return false
}
ensureCompositeStateMaps(st)
if st.CompositeToolSuccess["MinContextSwitch"] {
return true
}
return false
}
func shouldSkipOrderConstraintCheck(st *ScheduleRefineState) bool {
return shouldSkipOriginOrderNormalization(st)
}
func runSingleRepairAction(ctx context.Context, chatModel *ark.ChatModel, st *ScheduleRefineState, emitStage func(stage, detail string)) error {
if st == nil {
return fmt.Errorf("nil state")
@@ -2047,7 +2117,7 @@ func alignSummaryWithHardCheck(st *ScheduleRefineState, summary string) string {
if st == nil {
return clean
}
passed := st.HardCheck.PhysicsPassed && st.HardCheck.OrderPassed && st.HardCheck.IntentPassed
passed := FinalHardCheckPassed(st)
if passed {
if st.RoundUsed == 0 {
return "本轮未执行调度动作0轮当前排程已满足终审条件。"