Version: 0.9.26.dev.260417

后端： 1. Prompt 层从 execute 专属骨架重构为全节点统一四段式 buildUnifiedStageMessages - 新增 unified_context.go：定义 StageMessagesConfig + buildUnifiedStageMessages 统一骨架，所有节点（Chat/Plan/Execute/Deliver/DeepAnswer）共用同一套 msg0~msg3 拼装逻辑 - 新增 conversation_view.go：通用对话历史渲染 buildConversationHistoryMessage，各节点复用，不再各自维护提取逻辑 - 新增 chat_context.go / plan_context.go / deliver_context.go：各节点自行渲染 msg1（对话视图）和 msg2（工作区），统一层只负责"怎么拼"，不再替节点决定"放什么" - Chat/Plan/Deliver/Execute 的 BuildXXXMessages 全部从 buildStageMessages 切到 buildUnifiedStageMessages，移除旧路径 - 删除 execute_pinned.go：execute 记忆渲染合并到统一层 renderUnifiedMemoryContext - Plan prompt 不再在 user prompt 中拼装任务类 ID 列表和 renderStateSummary，改为依赖 msg2 规划工作区；Chat 粗排判断从"上下文有任务类 ID"改为"批量调度需求" - Deliver prompt 新增 IsAborted/IsExhaustedTerminal 区分，支持粗排收口和主动终止场景 2. Execute ReAct 上下文简化——移除归档搬运、窗口裁剪和重复工具压缩 - 移除 splitExecuteLoopRecordsByBoundary、findLatestExecuteBoundaryMarker、tailExecuteLoops、compressExecuteLoopObservationsByTool、buildEarlyExecuteReactSummary、trimExecuteMessage1ByBudget 等六个函数 - 移除 executeLoopWindowLimit / executeConversationTurnLimit / executeMessage1MaxRunes 等预算常量 - msg1 不再从历史中归档上一轮 ReAct 结果，只保留真实对话流（user + assistant speak），全量注入 - msg2 不再按 loop_closed / step_advanced 边界切分"归档/活跃"，直接全量注入全部 ReAct Loop 记录 - token 预算由统一压缩层兜底，prompt 层不再做提前裁剪 3. 压缩层从 Execute 专属提升为全节点通用 UnifiedCompact - 删除 execute_compact.go（Execute 专属压缩文件） - 新增 unified_compact.go：UnifiedCompactInput 参数化，各节点（Plan/Chat/Deliver/Execute）构造时从自己的 NodeInput 提取公共字段，消除对 Execute 的直接依赖 - CompactionStore 接口扩展 LoadStageCompaction / SaveStageCompaction，各节点按 stageKey 独立维护压缩状态互不覆盖 - 非 4 段式消息时退化成按角色汇总统计，确保 context_token_stats 仍然刷新 4. Retry 重试机制全面下线 - dao/agent.go：saveChatHistoryCore / SaveChatHistory / SaveChatHistoryInTx 移除 retry_group_id / retry_index / retry_from_user_message_id / retry_from_assistant_message_id 四个参数，修复乱码注释 - dao/agent-cache.go：移除 ApplyRetrySeed 和 extractMessageHistoryID 两个方法 - conv/agent.go：ToEinoMessages 不再回灌 retry_* 字段到运行期上下文 - service/agentsvc/agent.go：移除 chatRetryMeta 及 resolveRetryGroupID / buildRetrySeed 等全部重试逻辑 - service/agentsvc/agent_quick_note.go：整个文件删除（retry 快速补写路径已无用） - service/events/chat_history_persist.go：移除 retry 参数传递 5. 节点层瘦身 + 可见消息逐条持久化 - agent_nodes.go 大幅简化：Chat/Plan/Execute/Deliver 节点方法移除 ToolSchema 注入、状态摘要渲染等逻辑，只做参数转发和状态落盘 - 新增 visible_message.go：persistVisibleAssistantMessage 统一处理可见 assistant speak 的实时持久化，失败仅记日志不中断主流程 - 新增 llm_debug.go：logNodeLLMContext 统一打印 LLM 上下文调试日志 - graph_run_state.go 新增 PersistVisibleMessageFunc 类型 + AgentGraphDeps.PersistVisibleMessage 字段 - service/agentsvc/agent_newagent.go 精简主循环，注入 PersistVisibleMessage 回调；agent_history.go 精简历史构建 - token_budget.go 移除 Execute 专属预算检查，统一到通用预算前端： 1. 移除 retry 相关 UI 和类型 - agent.ts 移除 retry_group_id / retry_index / retry_total 字段及 normalize 逻辑 - AssistantPanel.vue 移除 retry 相关 UI 和交互代码（约 700 行精简） - dashboard.ts 移除 retry 相关类型定义 - AssistantView.vue 微调 2. ContextWindowMeter 压缩次数展示和数值格式优化 - 新增 formatCompactCount 工具函数，千位以上用 k 单位压缩（如 80k） - 新增压缩次数显示 3.修复了新对话发消息时，user和assistant消息被自动调换的bug 仓库：无
2026-04-17 22:19:38 +08:00
parent d47a8bcabd
commit d8280cc647
39 changed files with 2095 additions and 2386 deletions
--- a/backend/newAgent/node/execute.go
+++ b/backend/newAgent/node/execute.go
@@ -60,6 +60,7 @@ type ExecuteNodeInput struct {
 	OriginalScheduleState *schedule.ScheduleState
 	AlwaysExecute         bool // true 时写工具跳过确认闸门直接执行
 	ThinkingEnabled       bool // 是否开启 thinking，由 config.yaml 的 agent.thinking.execute 注入
+	PersistVisibleMessage newagentmodel.PersistVisibleMessageFunc
 }

 // ExecuteRoundObservation 记录执行阶段每轮的关键观察。
@@ -184,19 +185,16 @@ func RunExecuteNode(ctx context.Context, input ExecuteNodeInput) error {
 	messages := newagentprompt.BuildExecuteMessages(flowState, conversationContext)

 	// 5.1 Token 预算检查 & 上下文压缩。
-	messages = compactExecuteMessagesIfNeeded(
-		ctx, messages, input, flowState, emitter,
-	)
+	messages = compactUnifiedMessagesIfNeeded(ctx, messages, UnifiedCompactInput{
+		Client:          input.Client,
+		CompactionStore: input.CompactionStore,
+		FlowState:       flowState,
+		Emitter:         emitter,
+		StageName:       executeStageName,
+		StatusBlockID:   executeStatusBlockID,
+	})

-	log.Printf(
-		"[DEBUG] execute LLM context begin chat=%s round=%d message_count=%d\n%s\n[DEBUG] execute LLM context end chat=%s round=%d",
-		flowState.ConversationID,
-		flowState.RoundUsed,
-		len(messages),
-		formatExecuteLLMMessagesForDebug(messages),
-		flowState.ConversationID,
-		flowState.RoundUsed,
-	)
+	logNodeLLMContext(executeStageName, "decision", flowState, messages)
 	decision, rawResult, err := infrallm.GenerateJSON[newagentmodel.ExecuteDecision](
 		ctx,
 		input.Client,
@@ -337,6 +335,7 @@ func RunExecuteNode(ctx context.Context, input ExecuteNodeInput) error {

 		if !isConfirmWithCard && !isAskUser && !isAbort {
 			// 推流给前端
+			msg := schema.AssistantMessage(speakText, nil)
 			if err := emitter.EmitPseudoAssistantText(
 				ctx,
 				executeSpeakBlockID,
@@ -346,6 +345,7 @@ func RunExecuteNode(ctx context.Context, input ExecuteNodeInput) error {
 			); err != nil {
 				return fmt.Errorf("执行文案推送失败: %w", err)
 			}
+			persistVisibleAssistantMessage(ctx, input.PersistVisibleMessage, flowState, msg)
 		}
 		// 1. confirm / ask_user 的 speak 仍要写入历史，避免下一轮 LLM 丢失自己的执行上下文。
 		// 2. abort 不在这里写历史，避免先输出中间 speak，再在 deliver 收到第二份终止文案。
@@ -1674,79 +1674,3 @@ func flattenForLog(text string) string {
 	text = strings.ReplaceAll(text, "\r", " ")
 	return strings.TrimSpace(text)
 }
-
-// formatExecuteLLMMessagesForDebug 将本轮送入 LLM 的完整消息上下文展开成可读多行日志。
-//
-// 说明：
-// 1. 按消息索引逐条输出，便于和上游上下文构造步骤逐项对齐；
-// 2. 完整输出 content / reasoning_content / tool_calls / extra，不做截断；
-// 3. 仅用于调试打点，不参与业务决策。
-func formatExecuteLLMMessagesForDebug(messages []*schema.Message) string {
-	if len(messages) == 0 {
-		return "(empty messages)"
-	}
-
-	var sb strings.Builder
-	for i, msg := range messages {
-		sb.WriteString(fmt.Sprintf("----- message[%d] -----\n", i))
-		if msg == nil {
-			sb.WriteString("role: <nil>\n\n")
-			continue
-		}
-
-		sb.WriteString(fmt.Sprintf("role: %s\n", msg.Role))
-
-		if strings.TrimSpace(msg.ToolCallID) != "" {
-			sb.WriteString(fmt.Sprintf("tool_call_id: %s\n", msg.ToolCallID))
-		}
-		if strings.TrimSpace(msg.ToolName) != "" {
-			sb.WriteString(fmt.Sprintf("tool_name: %s\n", msg.ToolName))
-		}
-
-		if len(msg.ToolCalls) > 0 {
-			sb.WriteString("tool_calls:\n")
-			for j, call := range msg.ToolCalls {
-				sb.WriteString(fmt.Sprintf("  - [%d] id=%s type=%s function=%s\n", j, call.ID, call.Type, call.Function.Name))
-				sb.WriteString("    arguments:\n")
-				sb.WriteString(indentMultilineForDebug(call.Function.Arguments, "      "))
-				sb.WriteString("\n")
-			}
-		}
-
-		if strings.TrimSpace(msg.ReasoningContent) != "" {
-			sb.WriteString("reasoning_content:\n")
-			sb.WriteString(indentMultilineForDebug(msg.ReasoningContent, "  "))
-			sb.WriteString("\n")
-		}
-
-		sb.WriteString("content:\n")
-		sb.WriteString(indentMultilineForDebug(msg.Content, "  "))
-		sb.WriteString("\n")
-
-		if len(msg.Extra) > 0 {
-			sb.WriteString("extra:\n")
-			raw, err := json.MarshalIndent(msg.Extra, "", "  ")
-			if err != nil {
-				sb.WriteString(indentMultilineForDebug("<marshal_error>", "  "))
-			} else {
-				sb.WriteString(indentMultilineForDebug(string(raw), "  "))
-			}
-			sb.WriteString("\n")
-		}
-
-		sb.WriteString("\n")
-	}
-	return sb.String()
-}
-
-// indentMultilineForDebug 为多行文本统一添加前缀缩进，避免日志折行后难以阅读。
-func indentMultilineForDebug(text, prefix string) string {
-	if text == "" {
-		return prefix + "<empty>"
-	}
-	lines := strings.Split(text, "\n")
-	for i := range lines {
-		lines[i] = prefix + lines[i]
-	}
-	return strings.Join(lines, "\n")
-}