feat(agent): ✨ 重构智能排程分流与双通道交付,补齐周级预算并接入连续微调复用 - 🔀 通用路由升级为 action 分流(chat/quick_note_create/task_query/schedule_plan),路由失败直接返回内部错误,不再回落聊天 - 🧭 智能排程链路重构:统一图编排与节点职责,完善日级/周级调优协作与提示词约束 - 📊 周级预算改为“有效周保底 + 负载加权分配”,避免有效周零预算并提升资源利用率 - ⚙️ 日级并发优化细化:按天拆分 DayGroup 并发执行,低收益天(suggested<=2)跳过,单天失败仅回退该天结果并继续全局 - 🧵 周级并发优化细化:按周并发 worker 执行,单周“单步动作”循环(每轮仅 1 个 Move/Swap 或 done),失败周保留原方案不影响其它周 - 🛰️ 新增排程预览双通道:聊天主链路输出终审文本,结构化 candidate_plans 通过 /api/v1/agent/schedule-preview 拉取 - 🗃️ 增补 Redis 预览缓存读写与清理逻辑,新增对应 API、路由、模型与错误码支持 - ♻️ 接入连续对话微调复用:命中同会话历史预览时复用上轮 HybridEntries,避免每轮重跑粗排 - 🛡️ 增加复用保护:仅当本轮与上轮 task_class_ids 集合一致才复用;不一致回退全量粗排 - 🧰 扩展预览缓存字段(task_class_ids/hybrid_entries/allocated_items),支撑微调承接链路 - 🗺️ 更新 README 5.4 Mermaid(总分流图 + 智能排程流转图)并补充决策文档 - ⚠️ 新增“连续微调复用”链路我尚未完成测试,且文档状态目前较为混乱,待连续对话微调功能真正测试完成后再统一更新
388 lines
14 KiB
Go
388 lines
14 KiB
Go
package agentsvc
|
||
|
||
import (
|
||
"context"
|
||
"fmt"
|
||
"log"
|
||
"strings"
|
||
"time"
|
||
|
||
"github.com/LoveLosita/smartflow/backend/agent/chat"
|
||
"github.com/LoveLosita/smartflow/backend/agent/quicknote"
|
||
"github.com/LoveLosita/smartflow/backend/agent/route"
|
||
"github.com/LoveLosita/smartflow/backend/model"
|
||
"github.com/cloudwego/eino-ext/components/model/ark"
|
||
einoModel "github.com/cloudwego/eino/components/model"
|
||
"github.com/cloudwego/eino/schema"
|
||
"github.com/google/uuid"
|
||
arkModel "github.com/volcengine/volcengine-go-sdk/service/arkruntime/model"
|
||
)
|
||
|
||
// quickNoteRoutingDecision 只是路由层结果的本地别名。
|
||
// 保留这个别名是为了尽量少改调用侧(agent.go 中的字段访问保持不变)。
|
||
type quickNoteRoutingDecision = route.RoutingDecision
|
||
|
||
// quickNoteProgressEmitter 负责把“链路阶段状态”伪装成 OpenAI 兼容的 reasoning_content chunk。
|
||
// 设计目标:
|
||
// 1) 不改现有 OpenAI 兼容协议外壳;
|
||
// 2) 让 Apifox 在等待期间也能看到“思考块”,避免用户空等;
|
||
// 3) 该 emitter 只负责状态,不负责最终正文回复和 [DONE] 结束块。
|
||
type quickNoteProgressEmitter struct {
|
||
outChan chan<- string
|
||
modelName string
|
||
requestID string
|
||
created int64
|
||
enablePush bool
|
||
}
|
||
|
||
// newQuickNoteProgressEmitter 构造“阶段进度推送器”。
|
||
// 该推送器只负责发 reasoning 块,不负责正文回复。
|
||
func newQuickNoteProgressEmitter(outChan chan<- string, modelName string, enable bool) *quickNoteProgressEmitter {
|
||
// 1. 模型名兜底,避免出现空 model 字段导致客户端兼容性问题。
|
||
resolvedModel := strings.TrimSpace(modelName)
|
||
if resolvedModel == "" {
|
||
resolvedModel = "worker"
|
||
}
|
||
// 2. 每次请求生成独立 request_id,方便前端或日志侧关联本次流式输出。
|
||
return &quickNoteProgressEmitter{
|
||
outChan: outChan,
|
||
modelName: resolvedModel,
|
||
requestID: "chatcmpl-" + uuid.NewString(),
|
||
created: time.Now().Unix(),
|
||
enablePush: enable,
|
||
}
|
||
}
|
||
|
||
// Emit 按“阶段 + 说明”输出 reasoning_content。
|
||
// 注意:
|
||
// 1) 这里不输出 role,避免和后续正文 role 块冲突;
|
||
// 2) 即使发送失败,也只记录日志,不影响主流程继续执行。
|
||
func (e *quickNoteProgressEmitter) Emit(stage, detail string) {
|
||
// 1. 推送器不可用(nil/禁用/无通道)时直接返回,避免 panic。
|
||
if e == nil || !e.enablePush || e.outChan == nil {
|
||
return
|
||
}
|
||
// 2. 统一清理空白,避免日志和输出里出现异常空字符串。
|
||
stage = strings.TrimSpace(stage)
|
||
detail = strings.TrimSpace(detail)
|
||
if stage == "" && detail == "" {
|
||
return
|
||
}
|
||
|
||
reasoning := fmt.Sprintf("阶段:%s", stage)
|
||
if detail != "" {
|
||
reasoning += "\n" + detail
|
||
}
|
||
// 2.1 每条阶段消息末尾补双换行,避免客户端把多条 chunk 紧贴在同一行显示。
|
||
// 这里统一在 emitter 层处理,所有接入 emitStage 的链路都会受益。
|
||
reasoning += "\n\n"
|
||
|
||
// 3. 复用 OpenAI 兼容封装:把阶段文本伪装成 reasoning_content。
|
||
chunk, err := chat.ToOpenAIStream(&schema.Message{ReasoningContent: reasoning}, e.requestID, e.modelName, e.created, false)
|
||
if err != nil {
|
||
// 3.1 阶段推送失败不应影响主链路,只打日志即可。
|
||
log.Printf("输出随口记阶段状态失败 stage=%s err=%v", stage, err)
|
||
return
|
||
}
|
||
if chunk != "" {
|
||
e.outChan <- chunk
|
||
}
|
||
}
|
||
|
||
// tryHandleQuickNoteWithGraph 尝试用“随口记 graph”处理本次用户输入。
|
||
// 返回值语义:
|
||
// 1) handled=true:本次请求已在随口记链路处理完成(成功/失败都会返回文案);
|
||
// 2) handled=false:不是随口记意图,调用方应回落普通聊天链路;
|
||
// 3) state:用于拼接最终“一次性正文回复”。
|
||
func (s *AgentService) tryHandleQuickNoteWithGraph(
|
||
ctx context.Context,
|
||
selectedModel *ark.ChatModel,
|
||
userMessage string,
|
||
userID int,
|
||
chatID string,
|
||
traceID string,
|
||
trustRoute bool,
|
||
emitStage func(stage, detail string),
|
||
) (handled bool, state *quicknote.QuickNoteState, err error) {
|
||
// 1. 依赖预检:taskRepo 或模型未注入时,不做随口记处理,交给上层回落聊天。
|
||
if s.taskRepo == nil || selectedModel == nil {
|
||
return false, nil, nil
|
||
}
|
||
|
||
// 2. 初始化随口记状态对象(贯穿 graph 全流程的共享上下文)。
|
||
state = quicknote.NewQuickNoteState(traceID, userID, chatID, userMessage)
|
||
|
||
// 3. 执行 quick note graph。
|
||
// 本次依赖注入了两个“工具能力”:
|
||
// 3.1 ResolveUserID:从当前请求上下文确定 user_id;
|
||
// 3.2 CreateTask:真正执行任务写库。
|
||
finalState, runErr := quicknote.RunQuickNoteGraph(ctx, quicknote.QuickNoteGraphRunInput{
|
||
Model: selectedModel,
|
||
State: state,
|
||
Deps: quicknote.QuickNoteToolDeps{
|
||
ResolveUserID: func(ctx context.Context) (int, error) {
|
||
// 当前链路 userID 已由上层鉴权拿到,这里直接复用。
|
||
return userID, nil
|
||
},
|
||
CreateTask: func(ctx context.Context, req quicknote.QuickNoteCreateTaskRequest) (*quicknote.QuickNoteCreateTaskResult, error) {
|
||
// 3.2.1 把 quick note 的工具入参映射成项目 Task 模型。
|
||
taskModel := &model.Task{
|
||
UserID: req.UserID,
|
||
Title: req.Title,
|
||
Priority: req.PriorityGroup,
|
||
IsCompleted: false,
|
||
DeadlineAt: req.DeadlineAt,
|
||
UrgencyThresholdAt: req.UrgencyThresholdAt,
|
||
}
|
||
|
||
// 3.2.2 调用 DAO 写库。
|
||
created, createErr := s.taskRepo.AddTask(taskModel)
|
||
if createErr != nil {
|
||
return nil, createErr
|
||
}
|
||
|
||
// 3.2.3 把写库结果回填给 graph 状态,用于后续回复拼装。
|
||
return &quicknote.QuickNoteCreateTaskResult{
|
||
TaskID: created.ID,
|
||
Title: created.Title,
|
||
PriorityGroup: created.Priority,
|
||
DeadlineAt: created.DeadlineAt,
|
||
UrgencyThresholdAt: created.UrgencyThresholdAt,
|
||
}, nil
|
||
},
|
||
},
|
||
SkipIntentVerification: trustRoute,
|
||
EmitStage: emitStage,
|
||
})
|
||
if runErr != nil {
|
||
// 4. graph 执行失败由上层统一决定是否回退普通聊天。
|
||
return false, nil, runErr
|
||
}
|
||
|
||
// 5. graph 正常结束但判定“非随口记”时,明确返回 handled=false。
|
||
if finalState == nil || !finalState.IsQuickNoteIntent {
|
||
return false, nil, nil
|
||
}
|
||
// 6. 走到这里表示随口记链路已完成(含写库成功或业务失败反馈文案)。
|
||
return true, finalState, nil
|
||
}
|
||
|
||
// emitSingleAssistantCompletion 将单条完整回复包装成 OpenAI 兼容 chunk 流并写入 outChan。
|
||
// 说明:
|
||
// 1) 保持现有 OpenAI 兼容格式不变;
|
||
// 2) 正文只发一次,不做伪分段。
|
||
func emitSingleAssistantCompletion(outChan chan<- string, modelName, reply string) error {
|
||
// 1. 模型名兜底,保持 OpenAI 兼容响应字段完整。
|
||
if strings.TrimSpace(modelName) == "" {
|
||
modelName = "worker"
|
||
}
|
||
requestID := "chatcmpl-" + uuid.NewString()
|
||
created := time.Now().Unix()
|
||
|
||
// 2. 正文 chunk(完整一次性输出,不做人为拆片)。
|
||
chunk, err := chat.ToOpenAIStream(&schema.Message{Role: schema.Assistant, Content: reply}, requestID, modelName, created, true)
|
||
if err != nil {
|
||
return err
|
||
}
|
||
if chunk != "" {
|
||
outChan <- chunk
|
||
}
|
||
|
||
// 3. 按 OpenAI 风格补 finish chunk + [DONE],确保客户端可正确收尾。
|
||
finishChunk, err := chat.ToOpenAIFinishStream(requestID, modelName, created)
|
||
if err != nil {
|
||
return err
|
||
}
|
||
outChan <- finishChunk
|
||
outChan <- "[DONE]"
|
||
return nil
|
||
}
|
||
|
||
// buildQuickNoteFinalReply 生成最终的一次性正文回复。
|
||
// 组合策略:
|
||
// 1) 任务事实(标题/优先级/截止时间)由后端拼接,确保准确;
|
||
// 2) 轻松跟进句交给 AI 生成,贴合用户话题;
|
||
// 3) AI 生成失败时自动降级为固定友好文案,保证稳定可用。
|
||
func buildQuickNoteFinalReply(ctx context.Context, selectedModel *ark.ChatModel, userMessage string, state *quicknote.QuickNoteState) string {
|
||
// 1. 极端兜底:状态为空时给出稳定失败文案,避免返回空字符串。
|
||
if state == nil {
|
||
return "我这次没成功记上,别急,再发我一次我马上补上。"
|
||
}
|
||
|
||
// 仅当“确实拿到了有效 task_id”时才走成功文案,避免出现“回复成功但库里没数据”的错觉。
|
||
if state.Persisted && state.PersistedTaskID > 0 {
|
||
// 2. 组装“事实段”:标题 + 优先级 + 截止时间。
|
||
title := strings.TrimSpace(state.ExtractedTitle)
|
||
if title == "" {
|
||
title = "这条任务"
|
||
}
|
||
|
||
priorityText := "已安排优先级"
|
||
if quicknote.IsValidTaskPriority(state.ExtractedPriority) {
|
||
priorityText = fmt.Sprintf("优先级:%s", quicknote.PriorityLabelCN(state.ExtractedPriority))
|
||
}
|
||
|
||
deadlineText := ""
|
||
if state.ExtractedDeadline != nil {
|
||
deadlineText = fmt.Sprintf(";截止时间 %s", state.ExtractedDeadline.In(time.Local).Format("2006-01-02 15:04"))
|
||
}
|
||
|
||
factLine := fmt.Sprintf("好,给你安排上了:%s(%s%s)。", title, priorityText, deadlineText)
|
||
|
||
// 2.1 如果 graph 单次请求已生成 banter,直接使用,避免重复调用模型。
|
||
if strings.TrimSpace(state.ExtractedBanter) != "" {
|
||
return factLine + " " + strings.TrimSpace(state.ExtractedBanter)
|
||
}
|
||
// 2.2 聚合调用模式下,通常已在主流程完成风格化,给稳定文案即可。
|
||
if state.PlannedBySingleCall {
|
||
return factLine + " 已帮你稳稳记下,放心推进。"
|
||
}
|
||
|
||
// 2.3 兜底生成轻松跟进句;失败则降级固定文案,确保体验连续。
|
||
banter, err := generateQuickNoteBanter(ctx, selectedModel, userMessage, title, priorityText, deadlineText)
|
||
if err != nil {
|
||
return factLine + " 这下可以先安心推进,不用等 ddl 来敲门了。"
|
||
}
|
||
if strings.TrimSpace(banter) == "" {
|
||
return factLine + " 这下可以先安心推进,不用等 ddl 来敲门了。"
|
||
}
|
||
return factLine + " " + banter
|
||
}
|
||
|
||
// 3. 若时间校验失败,优先返回“可执行的修正引导”。
|
||
if strings.TrimSpace(state.DeadlineValidationError) != "" {
|
||
return "我识别到你给了时间,但格式不够明确,暂时不敢乱记。你可以改成比如:2026-03-20 18:30、明天下午3点、下周一上午9点,我立刻帮你安排。"
|
||
}
|
||
|
||
// 4. 若 graph 已给出助手回复(例如非意图/业务失败原因),优先透传。
|
||
if strings.TrimSpace(state.AssistantReply) != "" {
|
||
return strings.TrimSpace(state.AssistantReply)
|
||
}
|
||
// 5. 最终兜底文案。
|
||
return "这次没成功写入任务,我没跑路,再给我一次我就把它稳稳记上。"
|
||
}
|
||
|
||
// generateQuickNoteBanter 让模型根据用户原话生成一条“贴题轻松句”。
|
||
// 约束:
|
||
// 1) 只生成跟进语气,不承担事实表达;
|
||
// 2) 不得改动任务事实;
|
||
// 3) 输出控制在一句,方便直接拼接在事实句后。
|
||
func generateQuickNoteBanter(
|
||
ctx context.Context,
|
||
selectedModel *ark.ChatModel,
|
||
userMessage string,
|
||
title string,
|
||
priorityText string,
|
||
deadlineText string,
|
||
) (string, error) {
|
||
// 1. 模型防御校验。
|
||
if selectedModel == nil {
|
||
return "", fmt.Errorf("model is nil")
|
||
}
|
||
|
||
// 2. 把事实信息显式塞入 prompt,约束模型只能“润色语气”。
|
||
prompt := fmt.Sprintf(`用户原话:%s
|
||
已确认事实:
|
||
- 任务标题:%s
|
||
- %s
|
||
- %s
|
||
|
||
请输出一句轻松自然的跟进话术(仅一句)。`,
|
||
strings.TrimSpace(userMessage),
|
||
strings.TrimSpace(title),
|
||
strings.TrimSpace(priorityText),
|
||
strings.TrimSpace(deadlineText),
|
||
)
|
||
|
||
// 3. 构造消息:
|
||
// - system:定义输出边界(一句话、不改事实);
|
||
// - user:提供本次上下文素材。
|
||
messages := []*schema.Message{
|
||
schema.SystemMessage(quicknote.QuickNoteReplyBanterPrompt),
|
||
schema.UserMessage(prompt),
|
||
}
|
||
|
||
// 4. 调用模型生成 banter,并显式关闭 thinking,减少额外延迟。
|
||
resp, err := selectedModel.Generate(ctx, messages,
|
||
ark.WithThinking(&arkModel.Thinking{Type: arkModel.ThinkingTypeDisabled}),
|
||
einoModel.WithTemperature(0.7),
|
||
einoModel.WithMaxTokens(72),
|
||
)
|
||
if err != nil {
|
||
return "", err
|
||
}
|
||
if resp == nil {
|
||
return "", fmt.Errorf("empty response")
|
||
}
|
||
|
||
// 5. 输出清洗:
|
||
// 5.1 去首尾空白与引号;
|
||
// 5.2 若模型多行输出,只取第一行;
|
||
// 5.3 最终为空则视为失败,让上层走降级文案。
|
||
text := strings.TrimSpace(resp.Content)
|
||
text = strings.Trim(text, "\"'“”‘’")
|
||
if text == "" {
|
||
return "", fmt.Errorf("empty content")
|
||
}
|
||
if idx := strings.Index(text, "\n"); idx >= 0 {
|
||
text = strings.TrimSpace(text[:idx])
|
||
}
|
||
return text, nil
|
||
}
|
||
|
||
// decideQuickNoteRouting 决定当前输入是否进入“随口记 graph”。
|
||
// 该函数只是服务层薄封装,具体控制码解析逻辑已下沉到 agent/route 包。
|
||
func (s *AgentService) decideQuickNoteRouting(ctx context.Context, selectedModel *ark.ChatModel, userMessage string) quickNoteRoutingDecision {
|
||
// 这里保留方法是为了让 AgentService 对外语义完整,
|
||
// 同时避免上层调用方直接依赖 route 包,降低耦合。
|
||
_ = s
|
||
return route.DecideQuickNoteRouting(ctx, selectedModel, userMessage)
|
||
}
|
||
|
||
// persistChatAfterReply 在“随口记 graph”返回后,复用当前项目的后置持久化策略:
|
||
// 1) 用户消息写 Redis + outbox/DB;
|
||
// 2) 助手消息写 Redis + outbox/DB。
|
||
func (s *AgentService) persistChatAfterReply(
|
||
ctx context.Context,
|
||
userID int,
|
||
chatID string,
|
||
userMessage string,
|
||
assistantReply string,
|
||
userTokens int,
|
||
assistantTokens int,
|
||
errChan chan error,
|
||
) {
|
||
// 1. 先把用户消息写入 Redis,保证会话上下文“马上可见”。
|
||
if err := s.agentCache.PushMessage(ctx, chatID, &schema.Message{Role: schema.User, Content: userMessage}); err != nil {
|
||
log.Printf("写入用户消息到 Redis 失败: %v", err)
|
||
}
|
||
|
||
// 2. 再把用户消息写入可靠持久化通道(outbox 或同步 DB)。
|
||
if err := s.PersistChatHistory(ctx, model.ChatHistoryPersistPayload{
|
||
UserID: userID,
|
||
ConversationID: chatID,
|
||
Role: "user",
|
||
Message: userMessage,
|
||
TokensConsumed: userTokens,
|
||
}); err != nil {
|
||
pushErrNonBlocking(errChan, err)
|
||
return
|
||
}
|
||
|
||
// 3. 助手消息同样遵循“Redis 先行 + 可靠持久化补齐”策略。
|
||
if err := s.agentCache.PushMessage(context.Background(), chatID, &schema.Message{Role: schema.Assistant, Content: assistantReply}); err != nil {
|
||
log.Printf("写入助手消息到 Redis 失败: %v", err)
|
||
}
|
||
|
||
// 4. 助手消息持久化失败不阻断主流程,通过 errChan 异步上报。
|
||
if err := s.PersistChatHistory(context.Background(), model.ChatHistoryPersistPayload{
|
||
UserID: userID,
|
||
ConversationID: chatID,
|
||
Role: "assistant",
|
||
Message: assistantReply,
|
||
TokensConsumed: assistantTokens,
|
||
}); err != nil {
|
||
pushErrNonBlocking(errChan, err)
|
||
}
|
||
}
|