Version: 0.5.4.dev.260313

feat(agent): 重构随口记为模型控制码分流 + 单请求聚合规划，关闭非流式thinking并修复假成功，将随口记全流程从10s+缩短到5s左右，显著提升用户体验路由层改为“模型控制码协议”分流（quick_note|chat），替换关键词/置信度猜测路由命中 quick_note 时信任路由，graph 跳过二次意图判定（减少一次 LLM 调用）新增单请求聚合规划：一次返回 title/deadline_at/priority_group/priority_reason/banter 快路径优先复用聚合结果；优先级缺失时本地兜底，避免再次触发优先级模型调用最终回复优先使用聚合 banter，聚合路径缺失时使用固定文案，不再额外润色调用非流式 Generate 全面显式关闭 thinking，并收紧 max_tokens/temperature（路由、JSON规划、banter）保留并强化写库成功门槛：task_id > 0 才允许成功回包，修复“回复成功但未落库”风险增加/更新测试：控制码解析、nonce 校验、标题提取、banter 复用与无效 task_id 防假成功保持 OpenAI 兼容 SSE 格式与现有流式聊天链路不变
2026-03-13 18:17:57 +08:00
parent e2d9347731
commit 0b7d1b999c
8 changed files with 629 additions and 75 deletions
--- a/backend/agent/prompt.go
+++ b/backend/agent/prompt.go
@@ -3,7 +3,8 @@ package agent
 const (
 	// SystemPrompt 全局系统人设：定义 SmartFlow 的基本调性
 	SystemPrompt = `你叫 SmartFlow，是专为重邮（CQUPT）学子打造的智能排程专家。
-你的回复应当专业、干练，偶尔可以带一点程序员式的冷幽默。`
+你的回复应当专业、干练，偶尔可以带一点程序员式的冷幽默。
+重要约束：你无法直接写入数据库。除非系统明确告知“任务已落库成功”，否则禁止使用“已安排/已记录/已帮你记下”等完成态表述。`

 	// SmartAssistantPrompt 合并了分诊与对话能力的超级提示词
 	SmartAssistantPrompt = `你叫 SmartFlow，是专为重邮（CQUPT）学子打造的智能排程专家。
--- a/backend/agent/quick_note_graph.go
+++ b/backend/agent/quick_note_graph.go
@@ -9,9 +9,11 @@ import (
 	"time"

 	"github.com/cloudwego/eino-ext/components/model/ark"
+	einoModel "github.com/cloudwego/eino/components/model"
 	"github.com/cloudwego/eino/components/tool"
 	"github.com/cloudwego/eino/compose"
 	"github.com/cloudwego/eino/schema"
+	arkModel "github.com/volcengine/volcengine-go-sdk/service/arkruntime/model"
 )

 const (
@@ -33,6 +35,18 @@ type quickNotePriorityModelOutput struct {
 	Reason        string `json:"reason"`
 }

+// quickNotePlanModelOutput 是“单请求聚合规划”节点的模型输出。
+// 说明：
+// - 路由命中 quick_note 时，尽量通过这一份结果覆盖“时间/优先级/润色”三步；
+// - 任一字段异常不应阻断主链路，后续会有本地兜底与校验。
+type quickNotePlanModelOutput struct {
+	Title          string `json:"title"`
+	DeadlineAt     string `json:"deadline_at"`
+	PriorityGroup  int    `json:"priority_group"`
+	PriorityReason string `json:"priority_reason"`
+	Banter         string `json:"banter"`
+}
+
 // QuickNoteGraphRunInput 是运行“随口记 graph”所需的输入依赖。
 // 说明：
 // - EmitStage 可选，用于把节点进度推送给外层（例如 SSE 状态块）；
@@ -42,6 +56,12 @@ type QuickNoteGraphRunInput struct {
 	State *QuickNoteState
 	Deps  QuickNoteToolDeps

+	// SkipIntentVerification=true 时，跳过“意图识别二次模型判定”：
+	// - 适用于上游路由已明确给出 quick_note 的场景；
+	// - 可减少一次模型调用，降低首包前等待；
+	// - 仍保留时间合法性校验与写库成功校验，避免脏数据与假成功。
+	SkipIntentVerification bool
+
 	EmitStage func(stage, detail string)
 }

@@ -95,6 +115,52 @@ func RunQuickNoteGraph(ctx context.Context, input QuickNoteGraphRunInput) (*Quic
 				return nil, errors.New("quick note graph: nil state in intent node")
 			}

+			if input.SkipIntentVerification {
+				emitStage("quick_note.intent.analyzing", "已由上游路由判定为任务请求，跳过二次意图判断。")
+				st.IsQuickNoteIntent = true
+				st.IntentJudgeReason = "上游路由已命中 quick_note，跳过二次意图判定"
+				st.PlannedBySingleCall = true
+
+				emitStage("quick_note.plan.generating", "正在一次性生成时间归一化、优先级与回复润色。")
+				plan, planErr := planQuickNoteInSingleCall(ctx, input.Model, st.RequestNowText, st.RequestNow, st.UserInput)
+				if planErr != nil {
+					st.IntentJudgeReason += "；聚合规划失败，回退本地兜底"
+				} else {
+					if strings.TrimSpace(plan.Title) != "" {
+						st.ExtractedTitle = strings.TrimSpace(plan.Title)
+					}
+					if plan.Deadline != nil {
+						st.ExtractedDeadline = plan.Deadline
+					}
+					st.ExtractedDeadlineText = strings.TrimSpace(plan.DeadlineText)
+					if IsValidTaskPriority(plan.PriorityGroup) {
+						st.ExtractedPriority = plan.PriorityGroup
+						st.ExtractedPriorityReason = strings.TrimSpace(plan.PriorityReason)
+					}
+					st.ExtractedBanter = strings.TrimSpace(plan.Banter)
+				}
+
+				if strings.TrimSpace(st.ExtractedTitle) == "" {
+					st.ExtractedTitle = deriveQuickNoteTitleFromInput(st.UserInput)
+				}
+
+				emitStage("quick_note.deadline.validating", "正在校验并归一化任务时间。")
+
+				// 仍以“用户原句”的本地解析与校验作为硬约束，防止模型给出非法时间。
+				userDeadline, userHasTimeHint, userDeadlineErr := parseOptionalDeadlineFromUserInput(st.UserInput, st.RequestNow)
+				if userHasTimeHint && userDeadlineErr != nil {
+					st.DeadlineValidationError = userDeadlineErr.Error()
+					st.AssistantReply = "我识别到你给了时间信息，但这个时间格式我没法准确解析，请改成例如：2026-03-20 18:30、明天下午3点、下周一上午9点。"
+					emitStage("quick_note.failed", "时间校验失败，未执行写入。")
+					return st, nil
+				}
+				if userDeadline != nil {
+					st.ExtractedDeadline = userDeadline
+					st.ExtractedDeadlineText = strings.TrimSpace(st.UserInput)
+				}
+				return st, nil
+			}
+
 			emitStage("quick_note.intent.analyzing", "正在分析用户输入是否属于任务安排请求。")

 			prompt := fmt.Sprintf(`当前时间（北京时间，精确到分钟）：%s
@@ -179,6 +245,21 @@ func RunQuickNoteGraph(ctx context.Context, input QuickNoteGraphRunInput) (*Quic
 				return st, nil
 			}

+			// 命中“单请求聚合规划”时，优先复用其优先级结果，避免重复模型调用。
+			if IsValidTaskPriority(st.ExtractedPriority) {
+				if strings.TrimSpace(st.ExtractedPriorityReason) == "" {
+					st.ExtractedPriorityReason = "复用聚合规划优先级"
+				}
+				emitStage("quick_note.priority.evaluating", "已复用聚合规划结果中的优先级。")
+				return st, nil
+			}
+			if input.SkipIntentVerification || st.PlannedBySingleCall {
+				st.ExtractedPriority = fallbackPriority(st)
+				st.ExtractedPriorityReason = "聚合规划未给出合法优先级，使用本地兜底"
+				emitStage("quick_note.priority.evaluating", "聚合优先级缺失，已使用本地兜底。")
+				return st, nil
+			}
+
 			emitStage("quick_note.priority.evaluating", "正在评估任务优先级。")

 			deadlineText := "无"
@@ -290,6 +371,20 @@ func RunQuickNoteGraph(ctx context.Context, input QuickNoteGraphRunInput) (*Quic
 				return st, nil
 			}

+			// 成功判定加硬门槛：必须拿到有效 task_id。
+			// 目的：
+			// 1) 防止工具返回结构异常时被误判为“写入成功”；
+			// 2) 避免出现“回复已安排，但数据库实际没记录”的错误体验；
+			// 3) 命中该分支时会走既有重试策略，重试耗尽后明确报错给用户。
+			if toolOutput.TaskID <= 0 {
+				st.RecordToolError(fmt.Sprintf("工具返回非法 task_id=%d", toolOutput.TaskID))
+				if !st.CanRetryTool() {
+					st.AssistantReply = "抱歉，这次我没能确认任务写入成功，请再发一次我立刻补上。"
+					emitStage("quick_note.failed", "写入结果缺少有效 task_id，已终止成功回包。")
+				}
+				return st, nil
+			}
+
 			st.RecordToolSuccess(toolOutput.TaskID)
 			if strings.TrimSpace(toolOutput.Title) != "" {
 				st.ExtractedTitle = strings.TrimSpace(toolOutput.Title)
@@ -397,11 +492,23 @@ func getInvokableToolByName(bundle *QuickNoteToolBundle, name string) (tool.Invo
 }

 func callModelForJSON(ctx context.Context, chatModel *ark.ChatModel, systemPrompt, userPrompt string) (string, error) {
+	return callModelForJSONWithMaxTokens(ctx, chatModel, systemPrompt, userPrompt, 256)
+}
+
+func callModelForJSONWithMaxTokens(ctx context.Context, chatModel *ark.ChatModel, systemPrompt, userPrompt string, maxTokens int) (string, error) {
 	messages := []*schema.Message{
 		schema.SystemMessage(systemPrompt),
 		schema.UserMessage(userPrompt),
 	}
-	resp, err := chatModel.Generate(ctx, messages)
+	opts := []einoModel.Option{
+		ark.WithThinking(&arkModel.Thinking{Type: arkModel.ThinkingTypeDisabled}),
+		einoModel.WithTemperature(0),
+	}
+	if maxTokens > 0 {
+		opts = append(opts, einoModel.WithMaxTokens(maxTokens))
+	}
+
+	resp, err := chatModel.Generate(ctx, messages, opts...)
 	if err != nil {
 		return "", err
 	}
@@ -415,6 +522,78 @@ func callModelForJSON(ctx context.Context, chatModel *ark.ChatModel, systemPromp
 	return content, nil
 }

+type quickNotePlannedResult struct {
+	Title          string
+	Deadline       *time.Time
+	DeadlineText   string
+	PriorityGroup  int
+	PriorityReason string
+	Banter         string
+}
+
+// planQuickNoteInSingleCall 在一次模型调用里完成“时间/优先级/banter”聚合规划。
+// 设计原则：
+// 1) 路由已命中 quick_note 时优先走该函数，减少串行模型调用；
+// 2) 输出字段解析失败时返回 error，让上层回退到本地/后续节点兜底；
+// 3) 对 banter 做轻量清洗，避免多行输出污染最终回复。
+func planQuickNoteInSingleCall(
+	ctx context.Context,
+	chatModel *ark.ChatModel,
+	nowText string,
+	now time.Time,
+	userInput string,
+) (*quickNotePlannedResult, error) {
+	prompt := fmt.Sprintf(`当前时间（北京时间，精确到分钟）：%s
+用户输入：%s
+
+请仅输出 JSON（不要 markdown，不要解释），字段如下：
+{
+  "title": string,
+  "deadline_at": string,
+  "priority_group": 1|2|3|4,
+  "priority_reason": string,
+  "banter": string
+}
+
+约束：
+1) deadline_at 只允许 "yyyy-MM-dd HH:mm" 或空字符串；
+2) 若用户给了相对时间（如明天/今晚/下周一），必须换算为绝对时间；
+3) banter 只允许一句中文，不超过30字，不得改动任务事实。`,
+		nowText,
+		strings.TrimSpace(userInput),
+	)
+
+	raw, err := callModelForJSONWithMaxTokens(ctx, chatModel, QuickNotePlanPrompt, prompt, 220)
+	if err != nil {
+		return nil, err
+	}
+	parsed, parseErr := parseJSONPayload[quickNotePlanModelOutput](raw)
+	if parseErr != nil {
+		return nil, parseErr
+	}
+
+	result := &quickNotePlannedResult{
+		Title:          strings.TrimSpace(parsed.Title),
+		DeadlineText:   strings.TrimSpace(parsed.DeadlineAt),
+		PriorityGroup:  parsed.PriorityGroup,
+		PriorityReason: strings.TrimSpace(parsed.PriorityReason),
+		Banter:         strings.TrimSpace(parsed.Banter),
+	}
+
+	if result.Banter != "" {
+		if idx := strings.Index(result.Banter, "\n"); idx >= 0 {
+			result.Banter = strings.TrimSpace(result.Banter[:idx])
+		}
+	}
+
+	if result.DeadlineText != "" {
+		if deadline, deadlineErr := parseOptionalDeadlineWithNow(result.DeadlineText, now); deadlineErr == nil {
+			result.Deadline = deadline
+		}
+	}
+	return result, nil
+}
+
 func parseJSONPayload[T any](raw string) (*T, error) {
 	clean := strings.TrimSpace(raw)
 	if clean == "" {
@@ -464,3 +643,43 @@ func fallbackPriority(st *QuickNoteState) int {
 	}
 	return QuickNotePrioritySimpleNotImportant
 }
+
+// deriveQuickNoteTitleFromInput 在“跳过二次意图判定”场景下，从用户原句提取任务标题。
+// 设计原则：
+// 1) 不依赖模型，避免再引入一次额外 LLM 调用；
+// 2) 优先保守提取，宁可稍长，也不要误删关键信息；
+// 3) 只做轻量清洗，不做复杂语义改写，保持可预期。
+func deriveQuickNoteTitleFromInput(userInput string) string {
+	text := strings.TrimSpace(userInput)
+	if text == "" {
+		return "这条任务"
+	}
+
+	// 去掉常见前缀口头语，保留核心任务描述。
+	prefixes := []string{
+		"请帮我", "麻烦帮我", "麻烦你", "帮我", "提醒我", "请提醒我", "记一下", "记个", "帮我记一下",
+	}
+	for _, prefix := range prefixes {
+		if strings.HasPrefix(text, prefix) {
+			text = strings.TrimSpace(strings.TrimPrefix(text, prefix))
+			break
+		}
+	}
+
+	// 去掉常见尾部提醒口头语，避免把“记得喊我/q我”也写入标题。
+	suffixSeparators := []string{
+		"，记得", ",记得", "，到时候", ",到时候", " 到时候", "，别忘了", ",别忘了", "。记得",
+	}
+	for _, sep := range suffixSeparators {
+		if idx := strings.Index(text, sep); idx > 0 {
+			text = strings.TrimSpace(text[:idx])
+			break
+		}
+	}
+
+	text = strings.Trim(text, "，,。.!！？；; ")
+	if text == "" {
+		return strings.TrimSpace(userInput)
+	}
+	return text
+}
--- a/backend/agent/quick_note_graph_test.go
+++ b/backend/agent/quick_note_graph_test.go
@@ -0,0 +1,36 @@
+package agent
+
+import "testing"
+
+func TestDeriveQuickNoteTitleFromInput(t *testing.T) {
+	cases := []struct {
+		name  string
+		input string
+		want  string
+	}{
+		{
+			name:  "保留核心事项并去掉尾部提醒口头语",
+			input: "明天上午12点我要去取快递，到时候记得q我",
+			want:  "明天上午12点我要去取快递",
+		},
+		{
+			name:  "去掉常见前缀口头语",
+			input: "提醒我周五下午三点交实验报告",
+			want:  "周五下午三点交实验报告",
+		},
+		{
+			name:  "空输入兜底",
+			input: "   ",
+			want:  "这条任务",
+		},
+	}
+
+	for _, tc := range cases {
+		t.Run(tc.name, func(t *testing.T) {
+			got := deriveQuickNoteTitleFromInput(tc.input)
+			if got != tc.want {
+				t.Fatalf("title 提取不符合预期，got=%q want=%q", got, tc.want)
+			}
+		})
+	}
+}
--- a/backend/agent/quick_note_prompt.go
+++ b/backend/agent/quick_note_prompt.go
@@ -1,6 +1,42 @@
 package agent

 const (
+	// QuickNoteRouteControlPrompt 用于“首段控制码分流”：
+	// - 仅负责判断用户输入应走 quick_note 还是 chat；
+	// - 不直接回答用户问题；
+	// - 必须输出可机读控制码，便于后端无歧义解析。
+	QuickNoteRouteControlPrompt = `你是 SmartFlow 的请求分流控制器。
+你的唯一任务是给后端返回可机读控制码，不要做用户可见回复，不要解释。
+
+判定规则：
+1) 若用户表达“希望你在将来提醒/记录/安排某件事”，输出 quick_note。
+2) 其余情况输出 chat（包括闲聊、知识问答、纯讨论、观点交流）。
+3) 口语变体（如“d我/q我/戳我/到点喊我/记得提醒我”）也属于 quick_note。
+
+输出格式必须严格如下（两行，大小写不敏感）：
+<SMARTFLOW_ROUTE nonce="给定nonce" action="quick_note|chat"></SMARTFLOW_ROUTE>
+<SMARTFLOW_REASON>一句不超过30字的中文理由</SMARTFLOW_REASON>
+
+	禁止输出任何其他内容。`
+
+	// QuickNotePlanPrompt 用于“单请求聚合规划”：
+	// - 在一次调用内完成标题抽取、时间归一化、优先级评估、跟进句生成；
+	// - 主要用于路由已明确命中 quick_note 的场景，以降低串行 LLM 调用次数。
+	QuickNotePlanPrompt = `你是 SmartFlow 的任务聚合规划器。
+你将基于用户输入，一次性输出任务规划结果，供后端直接写库。
+
+必须完成以下四件事：
+1) 提取任务标题 title（简洁明确）。
+2) 归一化截止时间 deadline_at（若存在时间线索，必须输出绝对时间）。
+3) 评估优先级 priority_group（1~4）。
+4) 生成一句轻松跟进句 banter（不超过30字）。
+
+输出要求：
+- 仅输出 JSON，不要 markdown，不要解释。
+- deadline_at 仅允许 "yyyy-MM-dd HH:mm" 或空字符串。
+- priority_group 仅允许 1|2|3|4。
+- banter 不得新增或修改任务事实（任务名、时间、优先级）。`
+
 	// QuickNoteIntentPrompt 用于第一阶段：判断用户输入是否属于“随口记”。
 	// 设计约束：
 	// 1) 只做识别与抽取，不允许模型宣称“已写库”；
--- a/backend/agent/state.go
+++ b/backend/agent/state.go
@@ -76,6 +76,12 @@ type QuickNoteState struct {
 	ExtractedDeadline     *time.Time
 	ExtractedDeadlineText string
 	ExtractedPriority     int
+	// ExtractedBanter 是聚合规划阶段生成的“轻松跟进句”。
+	// 该字段非空时，最终回复阶段可直接复用，避免再触发一次独立润色模型调用。
+	ExtractedBanter string
+	// PlannedBySingleCall 标记本次是否走了“单请求聚合规划”快路径。
+	// 用于在后续节点做更激进的性能策略（例如缺失字段时直接本地兜底，避免再触发模型调用）。
+	PlannedBySingleCall bool

 	// ExtractedPriorityReason 记录优先级评估理由，便于后续排查模型判断是否符合预期。
 	ExtractedPriorityReason string