Version: 0.5.2.dev.260312

feat(agent): ✨ 在 Agent 聊天接口中新增 AI 随口记功能 * 无相关意图时保持正常聊天，若识别到相关意图则自动切换为随口记模式 * 支持阶段状态反馈与话题化回复，提升交互体验 - 引入请求级当前时间基准，支持相对时间解析（如“明天”、“下周一”等） - 增加非法日期拦截机制，防止用户输入格式错误的时间并返回修正提示 - 优化随口记图谱，补充阶段打点与详细中文注释，失败/重试分支处理更清晰 - 推送 `reasoning_content` 阶段状态，涵盖 `request.accepted`、`intent`、`deadline`、`priority`、`persisting`、`persisted`、`reply.polishing` 等状态 - 最终文案改为“事实句 + AI 生成的贴题轻松跟进句”，避免硬编码调侃内容 - 完善时间解析相关测试，确保功能正确性，测试通过 `go test ./...` --- improvements: 🛠️ 开发心路历程与优化 * 修复随口记链路中 `assistant` 消息未写入 Redis 的问题，确保消息持久化 * 去除“分段正文伪流式”处理，改为最终正文一次性输出，简化内容流转
2026-03-12 22:17:20 +08:00
parent 912a6d8cfe
commit fb87ceaff5
11 changed files with 1917 additions and 129 deletions
--- a/backend/service/agent.go
+++ b/backend/service/agent.go
@@ -20,14 +20,16 @@ import (
 type AgentService struct {
 	AIHub         *inits.AIHub
 	repo          *dao.AgentDAO
+	taskRepo      *dao.TaskDAO
 	agentCache    *dao.AgentCache
 	asyncPipeline *AgentAsyncPipeline
 }

-func NewAgentService(aiHub *inits.AIHub, repo *dao.AgentDAO, agentRedis *dao.AgentCache, asyncPipeline *AgentAsyncPipeline) *AgentService {
+func NewAgentService(aiHub *inits.AIHub, repo *dao.AgentDAO, taskRepo *dao.TaskDAO, agentRedis *dao.AgentCache, asyncPipeline *AgentAsyncPipeline) *AgentService {
 	return &AgentService{
 		AIHub:         aiHub,
 		repo:          repo,
+		taskRepo:      taskRepo,
 		agentCache:    agentRedis,
 		asyncPipeline: asyncPipeline,
 	}
@@ -67,18 +69,104 @@ func pushErrNonBlocking(errChan chan error, err error) {
 	}
 }

+// runNormalChatFlow 执行普通流式聊天链路（非随口记）。
+// 该函数被两处复用：
+// 1) 用户输入本就不是随口记；
+// 2) 开启随口记进度推送后，最终判定“非随口记”时回落到普通聊天。
+func (s *AgentService) runNormalChatFlow(
+	ctx context.Context,
+	selectedModel *ark.ChatModel,
+	resolvedModelName string,
+	userMessage string,
+	ifThinking bool,
+	userID int,
+	chatID string,
+	traceID string,
+	requestStart time.Time,
+	outChan chan<- string,
+	errChan chan error,
+) {
+	chatHistory, err := s.agentCache.GetHistory(ctx, chatID)
+	if err != nil {
+		pushErrNonBlocking(errChan, err)
+		return
+	}
+
+	cacheMiss := false
+	if chatHistory == nil {
+		cacheMiss = true
+		histories, hisErr := s.repo.GetUserChatHistories(ctx, userID, pkg.HistoryFetchLimitByModel(resolvedModelName), chatID)
+		if hisErr != nil {
+			pushErrNonBlocking(errChan, hisErr)
+			return
+		}
+		chatHistory = conv.ToEinoMessages(histories)
+	}
+
+	historyBudget := pkg.HistoryTokenBudgetByModel(resolvedModelName, agent.SystemPrompt, userMessage)
+	trimmedHistory, totalHistoryTokens, keptHistoryTokens, droppedCount := pkg.TrimHistoryByTokenBudget(chatHistory, historyBudget)
+	chatHistory = trimmedHistory
+
+	targetWindow := pkg.CalcSessionWindowSize(len(chatHistory))
+	if err = s.agentCache.SetSessionWindowSize(ctx, chatID, targetWindow); err != nil {
+		log.Printf("设置历史窗口失败 chat=%s: %v", chatID, err)
+	}
+	if err = s.agentCache.EnforceHistoryWindow(ctx, chatID); err != nil {
+		log.Printf("执行历史窗口裁剪失败 chat=%s: %v", chatID, err)
+	}
+
+	if droppedCount > 0 {
+		log.Printf("历史裁剪: chat=%s total_tokens=%d kept_tokens=%d dropped=%d budget=%d target_window=%d",
+			chatID, totalHistoryTokens, keptHistoryTokens, droppedCount, historyBudget, targetWindow)
+	}
+
+	if cacheMiss {
+		if err = s.agentCache.BackfillHistory(ctx, chatID, chatHistory); err != nil {
+			pushErrNonBlocking(errChan, err)
+			return
+		}
+	}
+
+	fullText, streamErr := agent.StreamChat(ctx, selectedModel, resolvedModelName, userMessage, ifThinking, chatHistory, outChan, traceID, chatID, requestStart)
+	if streamErr != nil {
+		pushErrNonBlocking(errChan, streamErr)
+		return
+	}
+
+	if err = s.agentCache.PushMessage(ctx, chatID, &schema.Message{Role: schema.User, Content: userMessage}); err != nil {
+		log.Printf("写入用户消息到 Redis 失败: %v", err)
+	}
+
+	if err = s.saveChatHistoryReliable(ctx, model.ChatHistoryPersistPayload{
+		UserID:         userID,
+		ConversationID: chatID,
+		Role:           "user",
+		Message:        userMessage,
+	}); err != nil {
+		pushErrNonBlocking(errChan, err)
+		return
+	}
+
+	if saveErr := s.saveChatHistoryReliable(context.Background(), model.ChatHistoryPersistPayload{
+		UserID:         userID,
+		ConversationID: chatID,
+		Role:           "assistant",
+		Message:        fullText,
+	}); saveErr != nil {
+		pushErrNonBlocking(errChan, saveErr)
+	}
+}
+
 func (s *AgentService) AgentChat(ctx context.Context, userMessage string, ifThinking bool, modelName string, userID int, chatID string) (<-chan string, <-chan error) {
 	requestStart := time.Now()
 	traceID := uuid.NewString()

-	outChan := make(chan string, 5)
+	outChan := make(chan string, 8)
 	errChan := make(chan error, 1)

 	// 1) 规范会话 ID，选择模型。
 	chatID = normalizeConversationID(chatID)
 	selectedModel, resolvedModelName := s.pickChatModel(modelName)
-	/*log.Printf("打点|请求开始|trace_id=%s|chat_id=%s|user_id=%d|model=%s|请求累计_ms=%d",
-	traceID, chatID, userID, resolvedModelName, time.Since(requestStart).Milliseconds())*/

 	// 2) 确保会话存在（优先缓存，必要时回源 DB 并创建）。
 	result, err := s.agentCache.GetConversationStatus(ctx, chatID)
@@ -109,121 +197,77 @@ func (s *AgentService) AgentChat(ctx context.Context, userMessage string, ifThin
 		}
 	}

-	// 3) 拉取并裁剪历史上下文。
-	chatHistory, err := s.agentCache.GetHistory(ctx, chatID)
-	if err != nil {
-		errChan <- err
-		close(outChan)
-		close(errChan)
+	// 3) 如果命中“任务安排关键词”，开启随口记阶段推送（伪装成 reasoning chunk）。
+	if shouldEmitQuickNoteProgress(userMessage) {
+		go func() {
+			defer close(outChan)
+
+			progress := newQuickNoteProgressEmitter(outChan, resolvedModelName, true)
+			progress.Emit("request.accepted", "检测到任务安排请求，开始执行随口记流程。")
+
+			quickHandled, quickState, quickErr := s.tryHandleQuickNoteWithGraph(
+				ctx,
+				selectedModel,
+				userMessage,
+				userID,
+				chatID,
+				traceID,
+				progress.Emit,
+			)
+			if quickErr != nil {
+				log.Printf("随口记 graph 执行失败，回退普通聊天 trace_id=%s chat_id=%s err=%v", traceID, chatID, quickErr)
+			}
+
+			if quickHandled {
+				progress.Emit("quick_note.reply.polishing", "正在结合你的话题润色回复。")
+				quickReply := buildQuickNoteFinalReply(ctx, selectedModel, userMessage, quickState)
+				if emitErr := emitSingleAssistantCompletion(outChan, resolvedModelName, quickReply); emitErr != nil {
+					pushErrNonBlocking(errChan, emitErr)
+					return
+				}
+
+				s.persistChatAfterReply(ctx, userID, chatID, userMessage, quickReply, errChan)
+				return
+			}
+
+			progress.Emit("quick_note.fallback", "当前输入不是随口记请求，切换到普通对话。")
+			s.runNormalChatFlow(ctx, selectedModel, resolvedModelName, userMessage, ifThinking, userID, chatID, traceID, requestStart, outChan, errChan)
+		}()
 		return outChan, errChan
 	}

-	cacheMiss := false
-	if chatHistory == nil {
-		cacheMiss = true
-		histories, hisErr := s.repo.GetUserChatHistories(ctx, userID, pkg.HistoryFetchLimitByModel(resolvedModelName), chatID)
-		if hisErr != nil {
-			errChan <- hisErr
-			close(outChan)
-			close(errChan)
-			return outChan, errChan
-		}
-		chatHistory = conv.ToEinoMessages(histories)
-	}
-
-	historyBudget := pkg.HistoryTokenBudgetByModel(resolvedModelName, agent.SystemPrompt, userMessage)
-	trimmedHistory, totalHistoryTokens, keptHistoryTokens, droppedCount := pkg.TrimHistoryByTokenBudget(chatHistory, historyBudget)
-	chatHistory = trimmedHistory
-
-	targetWindow := pkg.CalcSessionWindowSize(len(chatHistory))
-	if err = s.agentCache.SetSessionWindowSize(ctx, chatID, targetWindow); err != nil {
-		log.Printf("设置历史窗口失败 chat=%s: %v", chatID, err)
-	}
-	if err = s.agentCache.EnforceHistoryWindow(ctx, chatID); err != nil {
-		log.Printf("执行历史窗口裁剪失败 chat=%s: %v", chatID, err)
-	}
-
-	if droppedCount > 0 {
-		log.Printf("历史裁剪: chat=%s total_tokens=%d kept_tokens=%d dropped=%d budget=%d target_window=%d",
-			chatID, totalHistoryTokens, keptHistoryTokens, droppedCount, historyBudget, targetWindow)
-	}
-
-	if cacheMiss {
-		if err = s.agentCache.BackfillHistory(ctx, chatID, chatHistory); err != nil {
-			errChan <- err
-			close(outChan)
-			close(errChan)
-			return outChan, errChan
-		}
-	}
-
-	// 单请求主链路打点：开流前准备完成。
-	/*log.Printf("打点|开流前准备完成|trace_id=%s|chat_id=%s|本步耗时_ms=%d|请求累计_ms=%d|history_len=%d|cache_miss=%t",
-		traceID,
+	// 4) 无阶段推送模式：保持原逻辑，先尝试随口记，不命中再走普通聊天。
+	quickHandled, quickState, quickErr := s.tryHandleQuickNoteWithGraph(
+		ctx,
+		selectedModel,
+		userMessage,
+		userID,
 		chatID,
-		time.Since(requestStart).Milliseconds(),
-		time.Since(requestStart).Milliseconds(),
-		len(chatHistory),
-		cacheMiss,
-	)*/
+		traceID,
+		nil,
+	)
+	if quickErr != nil {
+		log.Printf("随口记 graph 执行失败，回退普通聊天 trace_id=%s chat_id=%s err=%v", traceID, chatID, quickErr)
+	}
+	if quickHandled {
+		go func() {
+			defer close(outChan)

-	// 4) 启动流式输出，回答完成后执行后置持久化。
+			quickReply := buildQuickNoteFinalReply(ctx, selectedModel, userMessage, quickState)
+			if emitErr := emitSingleAssistantCompletion(outChan, resolvedModelName, quickReply); emitErr != nil {
+				pushErrNonBlocking(errChan, emitErr)
+				return
+			}
+
+			s.persistChatAfterReply(ctx, userID, chatID, userMessage, quickReply, errChan)
+		}()
+		return outChan, errChan
+	}
+
+	// 5) 普通流式聊天。
 	go func() {
 		defer close(outChan)
-
-		/*streamStart := time.Now()*/
-		fullText, streamErr := agent.StreamChat(ctx, selectedModel, resolvedModelName, userMessage, ifThinking, chatHistory, outChan, traceID, chatID, requestStart)
-		if streamErr != nil {
-			pushErrNonBlocking(errChan, streamErr)
-			return
-		}
-		/*log.Printf("打点|流式输出完成|trace_id=%s|chat_id=%s|本步耗时_ms=%d|请求累计_ms=%d|reply_chars=%d",
-			traceID, chatID, time.Since(streamStart).Milliseconds(), time.Since(requestStart).Milliseconds(), len(fullText))
-
-		postPersistStart := time.Now()
-
-		stepStart := time.Now()*/
-		if err = s.agentCache.PushMessage(ctx, chatID, &schema.Message{Role: schema.User, Content: userMessage}); err != nil {
-			log.Printf("写入用户消息到 Redis 失败: %v", err)
-		}
-		/*log.Printf("打点|后置持久化_用户_写Redis|trace_id=%s|chat_id=%s|本步耗时_ms=%d|请求累计_ms=%d",
-			traceID, chatID, time.Since(stepStart).Milliseconds(), time.Since(requestStart).Milliseconds())
-
-		stepStart = time.Now()*/
-		if err = s.saveChatHistoryReliable(ctx, model.ChatHistoryPersistPayload{
-			UserID:         userID,
-			ConversationID: chatID,
-			Role:           "user",
-			Message:        userMessage,
-		}); err != nil {
-			errChan <- err
-			close(outChan)
-			close(errChan)
-		}
-		/*log.Printf("打点|后置持久化_用户_写持久化请求|trace_id=%s|chat_id=%s|本步耗时_ms=%d|请求累计_ms=%d",
-			traceID, chatID, time.Since(stepStart).Milliseconds(), time.Since(requestStart).Milliseconds())
-
-		stepStart = time.Now()
-		if cacheErr := s.agentCache.PushMessage(context.Background(), chatID, &schema.Message{Role: schema.Assistant, Content: fullText}); cacheErr != nil {
-			log.Printf("写入助手消息到 Redis 失败: %v", cacheErr)
-		}
-		log.Printf("打点|后置持久化_助手_写Redis|trace_id=%s|chat_id=%s|本步耗时_ms=%d|请求累计_ms=%d",
-			traceID, chatID, time.Since(stepStart).Milliseconds(), time.Since(requestStart).Milliseconds())
-
-		stepStart = time.Now()*/
-		if saveErr := s.saveChatHistoryReliable(context.Background(), model.ChatHistoryPersistPayload{
-			UserID:         userID,
-			ConversationID: chatID,
-			Role:           "assistant",
-			Message:        fullText,
-		}); saveErr != nil {
-			pushErrNonBlocking(errChan, saveErr)
-		}
-		/*log.Printf("打点|后置持久化_助手_写持久化请求|trace_id=%s|chat_id=%s|本步耗时_ms=%d|请求累计_ms=%d",
-			traceID, chatID, time.Since(stepStart).Milliseconds(), time.Since(requestStart).Milliseconds())
-
-		log.Printf("打点|后置持久化完成|trace_id=%s|chat_id=%s|本步耗时_ms=%d|请求累计_ms=%d",
-			traceID, chatID, time.Since(postPersistStart).Milliseconds(), time.Since(requestStart).Milliseconds())*/
+		s.runNormalChatFlow(ctx, selectedModel, resolvedModelName, userMessage, ifThinking, userID, chatID, traceID, requestStart, outChan, errChan)
 	}()

 	return outChan, errChan
--- a/backend/service/agent_quick_note.go
+++ b/backend/service/agent_quick_note.go
@@ -0,0 +1,316 @@
+package service
+
+import (
+	"context"
+	"fmt"
+	"log"
+	"strings"
+	"time"
+
+	"github.com/LoveLosita/smartflow/backend/agent"
+	"github.com/LoveLosita/smartflow/backend/model"
+	"github.com/cloudwego/eino-ext/components/model/ark"
+	"github.com/cloudwego/eino/schema"
+	"github.com/google/uuid"
+)
+
+// quickNoteProgressEmitter 负责把“链路阶段状态”伪装成 OpenAI 兼容的 reasoning_content chunk。
+// 设计目标：
+// 1) 不改现有 OpenAI 兼容协议外壳；
+// 2) 让 Apifox 在等待期间也能看到“思考块”，避免用户空等；
+// 3) 该 emitter 只负责状态，不负责最终正文回复和 [DONE] 结束块。
+type quickNoteProgressEmitter struct {
+	outChan    chan<- string
+	modelName  string
+	requestID  string
+	created    int64
+	enablePush bool
+}
+
+func newQuickNoteProgressEmitter(outChan chan<- string, modelName string, enable bool) *quickNoteProgressEmitter {
+	resolvedModel := strings.TrimSpace(modelName)
+	if resolvedModel == "" {
+		resolvedModel = "worker"
+	}
+	return &quickNoteProgressEmitter{
+		outChan:    outChan,
+		modelName:  resolvedModel,
+		requestID:  "chatcmpl-" + uuid.NewString(),
+		created:    time.Now().Unix(),
+		enablePush: enable,
+	}
+}
+
+// Emit 按“阶段 + 说明”输出 reasoning_content。
+// 注意：
+// - 这里不输出 role，避免和后续正文的 role 块冲突；
+// - 即使发送失败，也只记录日志，不影响主流程继续执行。
+func (e *quickNoteProgressEmitter) Emit(stage, detail string) {
+	if e == nil || !e.enablePush || e.outChan == nil {
+		return
+	}
+	stage = strings.TrimSpace(stage)
+	detail = strings.TrimSpace(detail)
+	if stage == "" && detail == "" {
+		return
+	}
+
+	reasoning := fmt.Sprintf("阶段：%s", stage)
+	if detail != "" {
+		reasoning += "\n" + detail
+	}
+
+	chunk, err := agent.ToOpenAIStream(&schema.Message{ReasoningContent: reasoning}, e.requestID, e.modelName, e.created, false)
+	if err != nil {
+		log.Printf("输出随口记阶段状态失败 stage=%s err=%v", stage, err)
+		return
+	}
+	if chunk != "" {
+		e.outChan <- chunk
+	}
+}
+
+// tryHandleQuickNoteWithGraph 尝试用“随口记 graph”处理本次用户输入。
+// 返回值语义：
+// - handled=true：本次请求已在随口记链路处理完成（成功/失败都会返回文案）；
+// - handled=false：不是随口记意图，调用方应回落普通聊天链路；
+// - state：用于拼接最终“一次性正文回复”。
+func (s *AgentService) tryHandleQuickNoteWithGraph(
+	ctx context.Context,
+	selectedModel *ark.ChatModel,
+	userMessage string,
+	userID int,
+	chatID string,
+	traceID string,
+	emitStage func(stage, detail string),
+) (handled bool, state *agent.QuickNoteState, err error) {
+	if s.taskRepo == nil || selectedModel == nil {
+		return false, nil, nil
+	}
+
+	state = agent.NewQuickNoteState(traceID, userID, chatID, userMessage)
+	finalState, runErr := agent.RunQuickNoteGraph(ctx, agent.QuickNoteGraphRunInput{
+		Model: selectedModel,
+		State: state,
+		Deps: agent.QuickNoteToolDeps{
+			ResolveUserID: func(ctx context.Context) (int, error) {
+				return userID, nil
+			},
+			CreateTask: func(ctx context.Context, req agent.QuickNoteCreateTaskRequest) (*agent.QuickNoteCreateTaskResult, error) {
+				taskModel := &model.Task{
+					UserID:      req.UserID,
+					Title:       req.Title,
+					Priority:    req.PriorityGroup,
+					IsCompleted: false,
+					DeadlineAt:  req.DeadlineAt,
+				}
+				created, createErr := s.taskRepo.AddTask(taskModel)
+				if createErr != nil {
+					return nil, createErr
+				}
+				return &agent.QuickNoteCreateTaskResult{
+					TaskID:        created.ID,
+					Title:         created.Title,
+					PriorityGroup: created.Priority,
+					DeadlineAt:    created.DeadlineAt,
+				}, nil
+			},
+		},
+		EmitStage: emitStage,
+	})
+	if runErr != nil {
+		return false, nil, runErr
+	}
+	if finalState == nil || !finalState.IsQuickNoteIntent {
+		return false, nil, nil
+	}
+
+	return true, finalState, nil
+}
+
+// emitSingleAssistantCompletion 将单条完整回复包装成 OpenAI 兼容 chunk 流并写入 outChan。
+// 说明：
+// - 保持现有 OpenAI 兼容格式不变；
+// - 正文只发一次，不做伪分段。
+func emitSingleAssistantCompletion(outChan chan<- string, modelName, reply string) error {
+	if strings.TrimSpace(modelName) == "" {
+		modelName = "worker"
+	}
+	requestID := "chatcmpl-" + uuid.NewString()
+	created := time.Now().Unix()
+
+	chunk, err := agent.ToOpenAIStream(&schema.Message{Role: schema.Assistant, Content: reply}, requestID, modelName, created, true)
+	if err != nil {
+		return err
+	}
+	if chunk != "" {
+		outChan <- chunk
+	}
+
+	finishChunk, err := agent.ToOpenAIFinishStream(requestID, modelName, created)
+	if err != nil {
+		return err
+	}
+	outChan <- finishChunk
+	outChan <- "[DONE]"
+	return nil
+}
+
+// buildQuickNoteFinalReply 生成最终的一次性正文回复。
+// 组合策略：
+// 1) 任务事实（标题/优先级/截止时间）由后端拼接，确保准确；
+// 2) 轻松跟进句交给 AI 生成，贴合用户话题（避免硬编码“薯饼”这类场景分支）；
+// 3) AI 生成失败时自动降级为固定友好文案，保证稳定可用。
+func buildQuickNoteFinalReply(ctx context.Context, selectedModel *ark.ChatModel, userMessage string, state *agent.QuickNoteState) string {
+	if state == nil {
+		return "我这次没成功记上，别急，再发我一次我马上补上。"
+	}
+
+	if state.Persisted {
+		title := strings.TrimSpace(state.ExtractedTitle)
+		if title == "" {
+			title = "这条任务"
+		}
+
+		priorityText := "已安排优先级"
+		if agent.IsValidTaskPriority(state.ExtractedPriority) {
+			priorityText = fmt.Sprintf("优先级：%s", agent.PriorityLabelCN(state.ExtractedPriority))
+		}
+
+		deadlineText := ""
+		if state.ExtractedDeadline != nil {
+			deadlineText = fmt.Sprintf("；截止时间 %s", state.ExtractedDeadline.In(time.Local).Format("2006-01-02 15:04"))
+		}
+
+		factLine := fmt.Sprintf("好，给你安排上了：%s（%s%s）。", title, priorityText, deadlineText)
+
+		banter, err := generateQuickNoteBanter(ctx, selectedModel, userMessage, title, priorityText, deadlineText)
+		if err != nil {
+			return factLine + " 这下可以先安心推进，不用等 ddl 来敲门了。"
+		}
+		if strings.TrimSpace(banter) == "" {
+			return factLine + " 这下可以先安心推进，不用等 ddl 来敲门了。"
+		}
+		return factLine + " " + banter
+	}
+
+	if strings.TrimSpace(state.DeadlineValidationError) != "" {
+		return "我识别到你给了时间，但格式不够明确，暂时不敢乱记。你可以改成比如：2026-03-20 18:30、明天下午3点、下周一上午9点，我立刻帮你安排。"
+	}
+
+	if strings.TrimSpace(state.AssistantReply) != "" {
+		return strings.TrimSpace(state.AssistantReply)
+	}
+	return "这次没成功写入任务，我没跑路，再给我一次我就把它稳稳记上。"
+}
+
+// generateQuickNoteBanter 让模型根据用户原话生成一条“贴题轻松句”。
+// 约束：
+// - 只生成跟进语气，不承担事实表达；
+// - 不得改动任务事实；
+// - 输出控制在一句，方便直接拼接在事实句后。
+func generateQuickNoteBanter(
+	ctx context.Context,
+	selectedModel *ark.ChatModel,
+	userMessage string,
+	title string,
+	priorityText string,
+	deadlineText string,
+) (string, error) {
+	if selectedModel == nil {
+		return "", fmt.Errorf("model is nil")
+	}
+
+	prompt := fmt.Sprintf(`用户原话：%s
+已确认事实：
+- 任务标题：%s
+- %s
+- %s
+
+请输出一句轻松自然的跟进话术（仅一句）。`,
+		strings.TrimSpace(userMessage),
+		strings.TrimSpace(title),
+		strings.TrimSpace(priorityText),
+		strings.TrimSpace(deadlineText),
+	)
+
+	messages := []*schema.Message{
+		schema.SystemMessage(agent.QuickNoteReplyBanterPrompt),
+		schema.UserMessage(prompt),
+	}
+
+	resp, err := selectedModel.Generate(ctx, messages)
+	if err != nil {
+		return "", err
+	}
+	if resp == nil {
+		return "", fmt.Errorf("empty response")
+	}
+
+	text := strings.TrimSpace(resp.Content)
+	text = strings.Trim(text, "\"'“”‘’")
+	if text == "" {
+		return "", fmt.Errorf("empty content")
+	}
+
+	// 简单兜底：只保留首行，避免模型输出多段。
+	if idx := strings.Index(text, "\n"); idx >= 0 {
+		text = strings.TrimSpace(text[:idx])
+	}
+	return text, nil
+}
+
+// shouldEmitQuickNoteProgress 用于判断是否应在“等待阶段”推送状态块。
+// 规则偏保守：只要出现明显“记任务/提醒”语义，就开启阶段推送。
+func shouldEmitQuickNoteProgress(userMessage string) bool {
+	text := strings.TrimSpace(userMessage)
+	if text == "" {
+		return false
+	}
+	keywords := []string{"记一下", "帮我记", "提醒", "任务", "待办", "日程", "安排", "截止", "ddl"}
+	for _, kw := range keywords {
+		if strings.Contains(text, kw) {
+			return true
+		}
+	}
+	return false
+}
+
+// persistChatAfterReply 在“随口记 graph”返回后，复用当前项目的后置持久化策略：
+// 1) 用户消息写 Redis + outbox/DB；
+// 2) 助手消息写 Redis + outbox/DB。
+func (s *AgentService) persistChatAfterReply(
+	ctx context.Context,
+	userID int,
+	chatID string,
+	userMessage string,
+	assistantReply string,
+	errChan chan error,
+) {
+	if err := s.agentCache.PushMessage(ctx, chatID, &schema.Message{Role: schema.User, Content: userMessage}); err != nil {
+		log.Printf("写入用户消息到 Redis 失败: %v", err)
+	}
+
+	if err := s.saveChatHistoryReliable(ctx, model.ChatHistoryPersistPayload{
+		UserID:         userID,
+		ConversationID: chatID,
+		Role:           "user",
+		Message:        userMessage,
+	}); err != nil {
+		pushErrNonBlocking(errChan, err)
+		return
+	}
+
+	if err := s.agentCache.PushMessage(context.Background(), chatID, &schema.Message{Role: schema.Assistant, Content: assistantReply}); err != nil {
+		log.Printf("写入助手消息到 Redis 失败: %v", err)
+	}
+
+	if err := s.saveChatHistoryReliable(context.Background(), model.ChatHistoryPersistPayload{
+		UserID:         userID,
+		ConversationID: chatID,
+		Role:           "assistant",
+		Message:        assistantReply,
+	}); err != nil {
+		pushErrNonBlocking(errChan, err)
+	}
+}