Version: 0.7.5.dev.260324

🐛 fix(agent/schedulerefine): 修复复合微调分支链路问题，并将 MinContextSwitch 重构为固定坑位重排语义 - 🔧 修复 `schedulerefine` 复合路由中参数透传不完整、缺少 deterministic objective 时错误降级，以及“复合工具执行成功”与“终审通过”语义混淆的问题 - ✅ 保证新的独立复合分支能够正确执行、正确出站，并统一交由 `hard_check` 裁决最终结果 - 🔍 排查时发现 `MinContextSwitch` 上游 `context_tag` 存在整体退化为 `General` 的风险，影响MinContextSwitch - 🛡️ 为 `MinContextSwitch` 增加兜底策略：当标签整体退化时，按任务名关键词推断学科分组，避免分组能力失效 - ♻️ 将 `MinContextSwitch` 从“整周重新寻找新坑位”调整为“坑位不变，任务顺序改变” - 🎯 将落地方式从顺序 `BatchMove` 改为固定坑位原子重写，避免出现远距离跳位、跨天错迁、异常嵌入课位及循环换位冲突 - 🧹 修复 `hard_check` 在 `MinContextSwitch` 成功后仍执行 `origin_rank` 顺序归位、并导致逆序终审误判的问题 - 🚦 命中该分支后跳过顺序归位与顺序硬校验，避免 `summary` / `hard_check` 将有效重排结果误判为失败 📈 当前连续微调规划涉及的全部功能已可以稳定运行；下一步将继续扩展能力边界，并进一步优化 `schedule_plan` 流程 ♻️ refactor: 重整 agent2 架构，并迁移 quicknote/chat 新链路，目前还剩3个模块未迁移，后续迁移完成后会删除原agent并将此目录命名为agent - 🏗️ 明确 `agent2` 采用“统一分层目录 + 文件分层 + 依赖注入”的重构方案，不再沿用模块目录多层嵌套结构 - 🧩 完善 `agent2` 基础骨架，统一收口 `entrance` / `router` / `llm` / `stream` / `shared` / `model` / `prompt` / `node` / `graph` 等层级职责 - 🚚 将通用路由能力迁移至 `agent2/router`，沉淀统一的 `Action`、`RoutingDecision`、控制码解析，以及 `Dispatcher` / `Resolver` 抽象 - 💬 将普通聊天链路迁移至 `agent2/chat`，复用 `stream` 的 OpenAI 兼容输出协议与 LLM usage 聚合能力 - 📝 将 `quicknote` 链路迁移到 `agent2` 新结构，拆分为 `model` / `prompt` / `llm` / `node` / `graph` 多层实现，替换对旧 `agent/quicknote` 的直接依赖 - 🔌 调整 `agentsvc` 对 `agent2` 的引用，普通聊天、通用分流与 `quicknote` 全部切换到新链路 - ✂️ 去除 graph 内部 `runner` 转接层，改为由 node 层直接持有请求级依赖，并向 graph 暴露节点方法 - 🧹 合并 `graph/quicknote` 与 `graph/quicknote_run`，删除冗余骨架文件，收敛为单一 `quicknote graph` 文件 - 📚 新增 `agent2`《通用能力接入文档》，明确公共能力边界、接入方式以及 graph/node 协作约定 - 📝 更新 `AGENTS.md`，要求后续扩展 `agent2` 通用能力时必须同步维护接入文档 ♻️ refactor: 删除了现Agent目录内Chat模块的两条冗余Prompt
2026-03-24 21:35:22 +08:00
parent e6941f98f2
commit f4ef6fb256
55 changed files with 5492 additions and 235 deletions
--- a/backend/agent/schedulerefine/nodes.go
+++ b/backend/agent/schedulerefine/nodes.go
@@ -300,7 +300,17 @@ func runCompositeRouteNode(
 			continue
 		}

-		lastReason = "未启用确定性目标，无法在复合路由直接收口"
+		// 1. “均匀分散/最少上下文切换”这类复合目标，未必能编译成 deterministic objective；
+		// 2. 只要本轮要求的复合工具已经成功执行，就允许独立复合分支直接出站并跳过 ReAct；
+		// 3. 最终是否真正达标，继续交给 hard_check 统一裁决，避免“工具成功却被路由误判失败”。
+		if reason, ok := allowCompositeRouteExitByToolSuccess(st, result); ok {
+			st.CompositeRouteSucceeded = true
+			emitStage("schedule_refine.route.handoff", truncate(reason, 180))
+			st.ActionLogs = append(st.ActionLogs, fmt.Sprintf("复合路由直接出站：tool=%s，reason=%s", required, reason))
+			return st, nil
+		}
+
+		lastReason = "未启用确定性目标，且复合工具门禁未满足，无法在复合路由直接出站"
 	}

 	// 1. 复合路由重试后仍失败，切入 ReAct 兜底并强制禁用复合工具。
@@ -343,6 +353,30 @@ func buildCompositeRouteTaskIDs(st *ScheduleRefineState) []int {
 	return out
 }

+// allowCompositeRouteExitByToolSuccess 判断“复合工具成功后，是否允许跳过 ReAct 直接进入终审”。
+//
+// 步骤化说明：
+// 1. 仅在当前没有 deterministic objective 时启用，避免覆盖原有“确定性验收优先”策略；
+// 2. 只有本轮要求的复合工具已成功、且成功工具名与门禁一致时才放行；
+// 3. 放行后并不代表最终成功，后续仍由 hard_check 做统一裁决。
+func allowCompositeRouteExitByToolSuccess(st *ScheduleRefineState, result reactToolResult) (string, bool) {
+	if st == nil || !result.Success {
+		return "", false
+	}
+	if strings.TrimSpace(st.Objective.Mode) != "" && strings.TrimSpace(st.Objective.Mode) != "none" {
+		return "", false
+	}
+	required := normalizeCompositeToolName(st.RequiredCompositeTool)
+	toolName := normalizeCompositeToolName(result.Tool)
+	if required == "" || toolName == "" || required != toolName {
+		return "", false
+	}
+	if !isRequiredCompositeSatisfied(st) {
+		return "", false
+	}
+	return fmt.Sprintf("复合工具 %s 已成功执行；当前目标暂不支持确定性收口，跳过 ReAct，交由终审裁决。", required), true
+}
+
 func buildCompositeRouteCall(st *ScheduleRefineState, tool string, taskIDs []int) reactToolCall {
 	limit := len(taskIDs) * 6
 	if limit < 12 {
@@ -729,7 +763,9 @@ func runHardCheckNode(
 	// 2. 后续顺序归位仅用于最终展示与顺序一致性，不得反向改变业务目标成败。
 	intentPassLocked, intentReasonLocked, intentUnmetLocked := evaluateIntentForJudgement(ctx, chatModel, st, emitStage)
 	emitStage("schedule_refine.hard_check.intent_locked", fmt.Sprintf("终审业务目标已锁定：pass=%t，reason=%s", intentPassLocked, truncate(intentReasonLocked, 120)))
-	if changed := normalizeMovableTaskOrderByOrigin(st); changed {
+	if changed, skipped := tryNormalizeMovableTaskOrderByOrigin(st); skipped {
+		emitStage("schedule_refine.hard_check.order_normalized", "已跳过顺序归位：MinContextSwitch 结果需要保留重排后的任务顺序。")
+	} else if changed {
 		emitStage("schedule_refine.hard_check.order_normalized", "已在终审前按 origin_rank 对坑位做顺序归位。")
 	}
 	report := evaluateHardChecks(ctx, chatModel, st, emitStage)
@@ -754,7 +790,9 @@ func runHardCheckNode(
 	}
 	intentPassLocked, intentReasonLocked, intentUnmetLocked = evaluateIntentForJudgement(ctx, chatModel, st, emitStage)
 	emitStage("schedule_refine.hard_check.intent_locked", fmt.Sprintf("修复后业务目标已锁定：pass=%t，reason=%s", intentPassLocked, truncate(intentReasonLocked, 120)))
-	if changed := normalizeMovableTaskOrderByOrigin(st); changed {
+	if changed, skipped := tryNormalizeMovableTaskOrderByOrigin(st); skipped {
+		emitStage("schedule_refine.hard_check.order_normalized", "修复后跳过顺序归位：MinContextSwitch 结果需要保留重排后的任务顺序。")
+	} else if changed {
 		emitStage("schedule_refine.hard_check.order_normalized", "修复后已按 origin_rank 对坑位做顺序归位。")
 	}
 	report = evaluateHardChecks(ctx, chatModel, st, emitStage)
@@ -795,7 +833,7 @@ func runSummaryNode(
 		emitModelRawDebug(emitStage, "summary", raw)
 	}
 	if err != nil || summary == "" {
-		if st.HardCheck.PhysicsPassed && st.HardCheck.OrderPassed && st.HardCheck.IntentPassed {
+		if FinalHardCheckPassed(st) {
 			summary = fmt.Sprintf("微调已完成，共执行 %d 轮动作，方案已通过终审。", st.RoundUsed)
 		} else {
 			summary = fmt.Sprintf("已完成微调并返回当前最优结果（执行 %d 轮动作）。终审仍有未满足项：%s。", st.RoundUsed, fallbackText(st.HardCheck.IntentReason, "请进一步明确微调目标"))
@@ -803,7 +841,10 @@ func runSummaryNode(
 	}
 	summary = alignSummaryWithHardCheck(st, summary)
 	st.FinalSummary = summary
-	st.Completed = true
+	// 1. Completed 只代表“最终终审已通过”，不再把“链路执行完毕”误写成成功；
+	// 2. 这样外层持久化与展示层可以准确区分“已通过方案”与“当前最优但未达标方案”；
+	// 3. 若只是返回 best-effort 结果，FinalSummary 仍会保留，但 Completed=false。
+	st.Completed = FinalHardCheckPassed(st)
 	emitStage("schedule_refine.summary.done", "微调总结已生成。")
 	return st, nil
 }
@@ -813,8 +854,9 @@ func evaluateHardChecks(ctx context.Context, chatModel *ark.ChatModel, st *Sched
 	report.PhysicsIssues = physicsCheck(st.HybridEntries, len(st.AllocatedItems))
 	report.PhysicsPassed = len(report.PhysicsIssues) == 0
 	// 1. 顺序校验默认开启：即便执行期放开顺序限制，终审也要验证“后端归位”后的顺序正确性。
-	// 2. 当 origin_order_map 为空时降级跳过，避免无基线时误报。
-	needOrderCheck := len(st.OriginOrderMap) > 0
+	// 2. 但 MinContextSwitch 成功后，重排后的顺序本身就是业务目标，不能再拿 origin_rank 反向判错。
+	// 3. 当 origin_order_map 为空时同样降级跳过，避免无基线时误报。
+	needOrderCheck := len(st.OriginOrderMap) > 0 && !shouldSkipOrderConstraintCheck(st)
 	report.OrderIssues = validateRelativeOrder(st.HybridEntries, refineToolPolicy{
 		KeepRelativeOrder: needOrderCheck,
 		OrderScope:        st.Contract.OrderScope,
@@ -1305,6 +1347,34 @@ func normalizeMovableTaskOrderByOrigin(st *ScheduleRefineState) bool {
 	return true
 }

+// tryNormalizeMovableTaskOrderByOrigin 决定是否执行“按 origin_rank 顺序归位”。
+//
+// 步骤化说明：
+// 1. 默认仍保持旧行为，继续在终审前做展示侧顺序归位；
+// 2. 但当 MinContextSwitch 已成功执行时，重排后的顺序本身就是业务目标的一部分；
+// 3. 此时若再按 origin_rank 归位，会把复合工具效果直接抹掉，因此必须跳过。
+func tryNormalizeMovableTaskOrderByOrigin(st *ScheduleRefineState) (changed bool, skipped bool) {
+	if shouldSkipOriginOrderNormalization(st) {
+		return false, true
+	}
+	return normalizeMovableTaskOrderByOrigin(st), false
+}
+
+func shouldSkipOriginOrderNormalization(st *ScheduleRefineState) bool {
+	if st == nil {
+		return false
+	}
+	ensureCompositeStateMaps(st)
+	if st.CompositeToolSuccess["MinContextSwitch"] {
+		return true
+	}
+	return false
+}
+
+func shouldSkipOrderConstraintCheck(st *ScheduleRefineState) bool {
+	return shouldSkipOriginOrderNormalization(st)
+}
+
 func runSingleRepairAction(ctx context.Context, chatModel *ark.ChatModel, st *ScheduleRefineState, emitStage func(stage, detail string)) error {
 	if st == nil {
 		return fmt.Errorf("nil state")
@@ -2047,7 +2117,7 @@ func alignSummaryWithHardCheck(st *ScheduleRefineState, summary string) string {
 	if st == nil {
 		return clean
 	}
-	passed := st.HardCheck.PhysicsPassed && st.HardCheck.OrderPassed && st.HardCheck.IntentPassed
+	passed := FinalHardCheckPassed(st)
 	if passed {
 		if st.RoundUsed == 0 {
 			return "本轮未执行调度动作（0轮），当前排程已满足终审条件。"