后端: 1. Prompt 层从 execute 专属骨架重构为全节点统一四段式 buildUnifiedStageMessages - 新增 unified_context.go:定义 StageMessagesConfig + buildUnifiedStageMessages 统一骨架,所有节点(Chat/Plan/Execute/Deliver/DeepAnswer)共用同一套 msg0~msg3 拼装逻辑 - 新增 conversation_view.go:通用对话历史渲染 buildConversationHistoryMessage,各节点复用,不再各自维护提取逻辑 - 新增 chat_context.go / plan_context.go / deliver_context.go:各节点自行渲染 msg1(对话视图)和 msg2(工作区),统一层只负责"怎么拼",不再替节点决定"放什么" - Chat/Plan/Deliver/Execute 的 BuildXXXMessages 全部从 buildStageMessages 切到 buildUnifiedStageMessages,移除旧路径 - 删除 execute_pinned.go:execute 记忆渲染合并到统一层 renderUnifiedMemoryContext - Plan prompt 不再在 user prompt 中拼装任务类 ID 列表和 renderStateSummary,改为依赖 msg2 规划工作区;Chat 粗排判断从"上下文有任务类 ID"改为"批量调度需求" - Deliver prompt 新增 IsAborted/IsExhaustedTerminal 区分,支持粗排收口和主动终止场景 2. Execute ReAct 上下文简化——移除归档搬运、窗口裁剪和重复工具压缩 - 移除 splitExecuteLoopRecordsByBoundary、findLatestExecuteBoundaryMarker、tailExecuteLoops、compressExecuteLoopObservationsByTool、buildEarlyExecuteReactSummary、trimExecuteMessage1ByBudget 等六个函数 - 移除 executeLoopWindowLimit / executeConversationTurnLimit / executeMessage1MaxRunes 等预算常量 - msg1 不再从历史中归档上一轮 ReAct 结果,只保留真实对话流(user + assistant speak),全量注入 - msg2 不再按 loop_closed / step_advanced 边界切分"归档/活跃",直接全量注入全部 ReAct Loop 记录 - token 预算由统一压缩层兜底,prompt 层不再做提前裁剪 3. 压缩层从 Execute 专属提升为全节点通用 UnifiedCompact - 删除 execute_compact.go(Execute 专属压缩文件) - 新增 unified_compact.go:UnifiedCompactInput 参数化,各节点(Plan/Chat/Deliver/Execute)构造时从自己的 NodeInput 提取公共字段,消除对 Execute 的直接依赖 - CompactionStore 接口扩展 LoadStageCompaction / SaveStageCompaction,各节点按 stageKey 独立维护压缩状态互不覆盖 - 非 4 段式消息时退化成按角色汇总统计,确保 context_token_stats 仍然刷新 4. Retry 重试机制全面下线 - dao/agent.go:saveChatHistoryCore / SaveChatHistory / SaveChatHistoryInTx 移除 retry_group_id / retry_index / retry_from_user_message_id / retry_from_assistant_message_id 四个参数,修复乱码注释 - dao/agent-cache.go:移除 ApplyRetrySeed 和 extractMessageHistoryID 两个方法 - conv/agent.go:ToEinoMessages 不再回灌 retry_* 字段到运行期上下文 - service/agentsvc/agent.go:移除 chatRetryMeta 及 resolveRetryGroupID / buildRetrySeed 等全部重试逻辑 - service/agentsvc/agent_quick_note.go:整个文件删除(retry 快速补写路径已无用) - service/events/chat_history_persist.go:移除 retry 参数传递 5. 节点层瘦身 + 可见消息逐条持久化 - agent_nodes.go 大幅简化:Chat/Plan/Execute/Deliver 节点方法移除 ToolSchema 注入、状态摘要渲染等逻辑,只做参数转发和状态落盘 - 新增 visible_message.go:persistVisibleAssistantMessage 统一处理可见 assistant speak 的实时持久化,失败仅记日志不中断主流程 - 新增 llm_debug.go:logNodeLLMContext 统一打印 LLM 上下文调试日志 - graph_run_state.go 新增 PersistVisibleMessageFunc 类型 + AgentGraphDeps.PersistVisibleMessage 字段 - service/agentsvc/agent_newagent.go 精简主循环,注入 PersistVisibleMessage 回调;agent_history.go 精简历史构建 - token_budget.go 移除 Execute 专属预算检查,统一到通用预算 前端: 1. 移除 retry 相关 UI 和类型 - agent.ts 移除 retry_group_id / retry_index / retry_total 字段及 normalize 逻辑 - AssistantPanel.vue 移除 retry 相关 UI 和交互代码(约 700 行精简) - dashboard.ts 移除 retry 相关类型定义 - AssistantView.vue 微调 2. ContextWindowMeter 压缩次数展示和数值格式优化 - 新增 formatCompactCount 工具函数,千位以上用 k 单位压缩(如 80k) - 新增压缩次数显示 3.修复了新对话发消息时,user和assistant消息被自动调换的bug 仓库:无
304 lines
11 KiB
Go
304 lines
11 KiB
Go
package agentsvc
|
||
|
||
import (
|
||
"context"
|
||
"fmt"
|
||
"log"
|
||
"strings"
|
||
"time"
|
||
|
||
agentgraph "github.com/LoveLosita/smartflow/backend/agent/graph"
|
||
agentllm "github.com/LoveLosita/smartflow/backend/agent/llm"
|
||
agentmodel "github.com/LoveLosita/smartflow/backend/agent/model"
|
||
agentnode "github.com/LoveLosita/smartflow/backend/agent/node"
|
||
agentrouter "github.com/LoveLosita/smartflow/backend/agent/router"
|
||
agentstream "github.com/LoveLosita/smartflow/backend/agent/stream"
|
||
"github.com/LoveLosita/smartflow/backend/model"
|
||
"github.com/cloudwego/eino-ext/components/model/ark"
|
||
"github.com/google/uuid"
|
||
)
|
||
|
||
// quickNoteRoutingDecision 只是路由层结果的本地别名。
|
||
// 保留这个别名是为了尽量少改调用侧(agent.go 中的字段访问保持不变)。
|
||
type quickNoteRoutingDecision = agentrouter.RoutingDecision
|
||
|
||
// quickNoteProgressEmitter 负责把“链路阶段状态”伪装成 OpenAI 兼容的 reasoning_content chunk。
|
||
// 设计目标:
|
||
// 1) 不改现有 OpenAI 兼容协议外壳;
|
||
// 2) 让 Apifox 在等待期间也能看到“思考块”,避免用户空等;
|
||
// 3) 该 emitter 只负责状态,不负责最终正文回复和 [DONE] 结束块。
|
||
type quickNoteProgressEmitter struct {
|
||
outChan chan<- string
|
||
modelName string
|
||
requestID string
|
||
created int64
|
||
enablePush bool
|
||
reasoning strings.Builder
|
||
startedAt *time.Time
|
||
}
|
||
|
||
// newQuickNoteProgressEmitter 构造“阶段进度推送器”。
|
||
// 该推送器只负责发 reasoning 块,不负责正文回复。
|
||
func newQuickNoteProgressEmitter(outChan chan<- string, modelName string, enable bool) *quickNoteProgressEmitter {
|
||
// 1. 模型名兜底,避免出现空 model 字段导致客户端兼容性问题。
|
||
resolvedModel := strings.TrimSpace(modelName)
|
||
if resolvedModel == "" {
|
||
resolvedModel = "worker"
|
||
}
|
||
// 2. 每次请求生成独立 request_id,方便前端或日志侧关联本次流式输出。
|
||
return &quickNoteProgressEmitter{
|
||
outChan: outChan,
|
||
modelName: resolvedModel,
|
||
requestID: "chatcmpl-" + uuid.NewString(),
|
||
created: time.Now().Unix(),
|
||
enablePush: enable,
|
||
}
|
||
}
|
||
|
||
// Emit 按“阶段 + 说明”输出 reasoning_content。
|
||
// 注意:
|
||
// 1) 这里不输出 role,避免和后续正文 role 块冲突;
|
||
// 2) 即使发送失败,也只记录日志,不影响主流程继续执行。
|
||
func (e *quickNoteProgressEmitter) Emit(stage, detail string) {
|
||
// 1. 推送器不可用(nil/禁用/无通道)时直接返回,避免 panic。
|
||
if e == nil || !e.enablePush || e.outChan == nil {
|
||
return
|
||
}
|
||
// 2. 统一清理空白,避免日志和输出里出现异常空字符串。
|
||
stage = strings.TrimSpace(stage)
|
||
detail = strings.TrimSpace(detail)
|
||
if stage == "" && detail == "" {
|
||
return
|
||
}
|
||
if e.startedAt == nil {
|
||
now := time.Now()
|
||
e.startedAt = &now
|
||
}
|
||
if e.reasoning.Len() > 0 {
|
||
e.reasoning.WriteString("\n\n")
|
||
}
|
||
if stage != "" {
|
||
e.reasoning.WriteString("阶段:")
|
||
e.reasoning.WriteString(stage)
|
||
}
|
||
if detail != "" {
|
||
if stage != "" {
|
||
e.reasoning.WriteString("\n")
|
||
}
|
||
e.reasoning.WriteString(detail)
|
||
}
|
||
|
||
// 3. 调用目的:阶段提示统一走 Agent/stream 的 reasoning chunk 包装,
|
||
// 避免 service 层继续自己拼 OpenAI 兼容 JSON。
|
||
err := agentstream.EmitStageAsReasoning(func(payload string) error {
|
||
e.outChan <- payload
|
||
return nil
|
||
}, e.requestID, e.modelName, e.created, stage, detail, false)
|
||
if err != nil {
|
||
// 3.1 阶段推送失败不应影响主链路,只打日志即可。
|
||
log.Printf("输出随口记阶段状态失败 stage=%s err=%v", stage, err)
|
||
return
|
||
}
|
||
}
|
||
|
||
func (e *quickNoteProgressEmitter) HistoryText() string {
|
||
if e == nil {
|
||
return ""
|
||
}
|
||
return strings.TrimSpace(e.reasoning.String())
|
||
}
|
||
|
||
func (e *quickNoteProgressEmitter) StartedAt() *time.Time {
|
||
if e == nil || e.startedAt == nil {
|
||
return nil
|
||
}
|
||
startCopy := *e.startedAt
|
||
return &startCopy
|
||
}
|
||
|
||
func (e *quickNoteProgressEmitter) DurationSeconds(end time.Time) int {
|
||
if e == nil || e.startedAt == nil {
|
||
return 0
|
||
}
|
||
if !end.After(*e.startedAt) {
|
||
return 0
|
||
}
|
||
return int(end.Sub(*e.startedAt) / time.Second)
|
||
}
|
||
|
||
// tryHandleQuickNoteWithGraph 尝试用“随口记 graph”处理本次用户输入。
|
||
// 返回值语义:
|
||
// 1) handled=true:本次请求已在随口记链路处理完成(成功/失败都会返回文案);
|
||
// 2) handled=false:不是随口记意图,调用方应回落普通聊天链路;
|
||
// 3) state:用于拼接最终“一次性正文回复”。
|
||
func (s *AgentService) tryHandleQuickNoteWithGraph(
|
||
ctx context.Context,
|
||
selectedModel *ark.ChatModel,
|
||
userMessage string,
|
||
userID int,
|
||
chatID string,
|
||
traceID string,
|
||
trustRoute bool,
|
||
emitStage func(stage, detail string),
|
||
) (handled bool, state *agentmodel.QuickNoteState, err error) {
|
||
// 1. 依赖预检:taskRepo 或模型未注入时,不做随口记处理,交给上层回落聊天。
|
||
if s.taskRepo == nil || selectedModel == nil {
|
||
return false, nil, nil
|
||
}
|
||
|
||
// 2. 初始化随口记状态对象(贯穿 graph 全流程的共享上下文)。
|
||
state = agentmodel.NewQuickNoteState(traceID, userID, chatID, userMessage)
|
||
|
||
// 3. 执行 quick note graph。
|
||
// 本次依赖注入了两个“工具能力”:
|
||
// 3.1 ResolveUserID:从当前请求上下文确定 user_id;
|
||
// 3.2 CreateTask:真正执行任务写库。
|
||
finalState, runErr := agentgraph.RunQuickNoteGraph(ctx, agentnode.QuickNoteGraphRunInput{
|
||
Model: selectedModel,
|
||
State: state,
|
||
Deps: agentnode.QuickNoteToolDeps{
|
||
ResolveUserID: func(ctx context.Context) (int, error) {
|
||
// 当前链路 userID 已由上层鉴权拿到,这里直接复用。
|
||
return userID, nil
|
||
},
|
||
CreateTask: func(ctx context.Context, req agentnode.QuickNoteCreateTaskRequest) (*agentnode.QuickNoteCreateTaskResult, error) {
|
||
// 3.2.1 把 quick note 的工具入参映射成项目 Task 模型。
|
||
taskModel := &model.Task{
|
||
UserID: req.UserID,
|
||
Title: req.Title,
|
||
Priority: req.PriorityGroup,
|
||
IsCompleted: false,
|
||
DeadlineAt: req.DeadlineAt,
|
||
UrgencyThresholdAt: req.UrgencyThresholdAt,
|
||
}
|
||
|
||
// 3.2.2 调用 DAO 写库。
|
||
created, createErr := s.taskRepo.AddTask(taskModel)
|
||
if createErr != nil {
|
||
return nil, createErr
|
||
}
|
||
|
||
// 3.2.3 把写库结果回填给 graph 状态,用于后续回复拼装。
|
||
return &agentnode.QuickNoteCreateTaskResult{
|
||
TaskID: created.ID,
|
||
Title: created.Title,
|
||
PriorityGroup: created.Priority,
|
||
DeadlineAt: created.DeadlineAt,
|
||
UrgencyThresholdAt: created.UrgencyThresholdAt,
|
||
}, nil
|
||
},
|
||
},
|
||
SkipIntentVerification: trustRoute,
|
||
EmitStage: emitStage,
|
||
})
|
||
if runErr != nil {
|
||
// 4. graph 执行失败由上层统一决定是否回退普通聊天。
|
||
return false, nil, runErr
|
||
}
|
||
|
||
// 5. graph 正常结束但判定“非随口记”时,明确返回 handled=false。
|
||
if finalState == nil || !finalState.IsQuickNoteIntent {
|
||
return false, nil, nil
|
||
}
|
||
// 6. 走到这里表示随口记链路已完成(含写库成功或业务失败反馈文案)。
|
||
return true, finalState, nil
|
||
}
|
||
|
||
// emitSingleAssistantCompletion 将单条完整回复包装成 OpenAI 兼容 chunk 流并写入 outChan。
|
||
// 说明:
|
||
// 1) 保持现有 OpenAI 兼容格式不变;
|
||
// 2) 正文只发一次,不做伪分段。
|
||
func emitSingleAssistantCompletion(outChan chan<- string, modelName, reply string) error {
|
||
// 1. 模型名兜底,保持 OpenAI 兼容响应字段完整。
|
||
if strings.TrimSpace(modelName) == "" {
|
||
modelName = "worker"
|
||
}
|
||
requestID := "chatcmpl-" + uuid.NewString()
|
||
created := time.Now().Unix()
|
||
|
||
emit := func(payload string) error {
|
||
outChan <- payload
|
||
return nil
|
||
}
|
||
if err := agentstream.EmitAssistantReply(emit, requestID, modelName, created, reply, true); err != nil {
|
||
return err
|
||
}
|
||
if err := agentstream.EmitFinish(emit, requestID, modelName, created); err != nil {
|
||
return err
|
||
}
|
||
return agentstream.EmitDone(emit)
|
||
}
|
||
|
||
// buildQuickNoteFinalReply 生成最终的一次性正文回复。
|
||
// 组合策略:
|
||
// 1) 任务事实(标题/优先级/截止时间)由后端拼接,确保准确;
|
||
// 2) 轻松跟进句交给 AI 生成,贴合用户话题;
|
||
// 3) AI 生成失败时自动降级为固定友好文案,保证稳定可用。
|
||
func buildQuickNoteFinalReply(ctx context.Context, selectedModel *ark.ChatModel, userMessage string, state *agentmodel.QuickNoteState) string {
|
||
// 1. 极端兜底:状态为空时给出稳定失败文案,避免返回空字符串。
|
||
if state == nil {
|
||
return "我这次没成功记上,别急,再发我一次我马上补上。"
|
||
}
|
||
|
||
// 仅当“确实拿到了有效 task_id”时才走成功文案,避免出现“回复成功但库里没数据”的错觉。
|
||
if state.Persisted && state.PersistedTaskID > 0 {
|
||
// 2. 组装“事实段”:标题 + 优先级 + 截止时间。
|
||
title := strings.TrimSpace(state.ExtractedTitle)
|
||
if title == "" {
|
||
title = "这条任务"
|
||
}
|
||
|
||
priorityText := "已安排优先级"
|
||
if agentmodel.IsValidTaskPriority(state.ExtractedPriority) {
|
||
priorityText = fmt.Sprintf("优先级:%s", agentmodel.PriorityLabelCN(state.ExtractedPriority))
|
||
}
|
||
|
||
deadlineText := ""
|
||
if state.ExtractedDeadline != nil {
|
||
deadlineText = fmt.Sprintf(";截止时间 %s", state.ExtractedDeadline.In(time.Local).Format("2006-01-02 15:04"))
|
||
}
|
||
|
||
factLine := fmt.Sprintf("好,给你安排上了:%s(%s%s)。", title, priorityText, deadlineText)
|
||
|
||
// 2.1 如果 graph 单次请求已生成 banter,直接使用,避免重复调用模型。
|
||
if strings.TrimSpace(state.ExtractedBanter) != "" {
|
||
return factLine + " " + strings.TrimSpace(state.ExtractedBanter)
|
||
}
|
||
// 2.2 聚合调用模式下,通常已在主流程完成风格化,给稳定文案即可。
|
||
if state.PlannedBySingleCall {
|
||
return factLine + " 已帮你稳稳记下,放心推进。"
|
||
}
|
||
|
||
// 2.3 兜底生成轻松跟进句;失败则降级固定文案,确保体验连续。
|
||
banter, err := agentllm.GenerateQuickNoteBanter(ctx, selectedModel, userMessage, title, priorityText, deadlineText)
|
||
if err != nil {
|
||
return factLine + " 这下可以先安心推进,不用等 ddl 来敲门了。"
|
||
}
|
||
if strings.TrimSpace(banter) == "" {
|
||
return factLine + " 这下可以先安心推进,不用等 ddl 来敲门了。"
|
||
}
|
||
return factLine + " " + banter
|
||
}
|
||
|
||
// 3. 若时间校验失败,优先返回“可执行的修正引导”。
|
||
if strings.TrimSpace(state.DeadlineValidationError) != "" {
|
||
return "我识别到你给了时间,但格式不够明确,暂时不敢乱记。你可以改成比如:2026-03-20 18:30、明天下午3点、下周一上午9点,我立刻帮你安排。"
|
||
}
|
||
|
||
// 4. 若 graph 已给出助手回复(例如非意图/业务失败原因),优先透传。
|
||
if strings.TrimSpace(state.AssistantReply) != "" {
|
||
return strings.TrimSpace(state.AssistantReply)
|
||
}
|
||
// 5. 最终兜底文案。
|
||
return "这次没成功写入任务,我没跑路,再给我一次我就把它稳稳记上。"
|
||
}
|
||
|
||
// decideQuickNoteRouting 决定当前输入是否进入“随口记 graph”。
|
||
// 该函数只是服务层薄封装,具体控制码解析逻辑已下沉到 Agent/router 包。
|
||
func (s *AgentService) decideQuickNoteRouting(ctx context.Context, selectedModel *ark.ChatModel, userMessage string) quickNoteRoutingDecision {
|
||
// 这里保留方法是为了让 AgentService 对外语义完整,
|
||
// 同时避免上层调用方直接依赖 Agent/router,降低耦合。
|
||
_ = s
|
||
return agentrouter.DecideQuickNoteRouting(ctx, selectedModel, userMessage)
|
||
}
|