后端: 1. Prompt 层从 execute 专属骨架重构为全节点统一四段式 buildUnifiedStageMessages - 新增 unified_context.go:定义 StageMessagesConfig + buildUnifiedStageMessages 统一骨架,所有节点(Chat/Plan/Execute/Deliver/DeepAnswer)共用同一套 msg0~msg3 拼装逻辑 - 新增 conversation_view.go:通用对话历史渲染 buildConversationHistoryMessage,各节点复用,不再各自维护提取逻辑 - 新增 chat_context.go / plan_context.go / deliver_context.go:各节点自行渲染 msg1(对话视图)和 msg2(工作区),统一层只负责"怎么拼",不再替节点决定"放什么" - Chat/Plan/Deliver/Execute 的 BuildXXXMessages 全部从 buildStageMessages 切到 buildUnifiedStageMessages,移除旧路径 - 删除 execute_pinned.go:execute 记忆渲染合并到统一层 renderUnifiedMemoryContext - Plan prompt 不再在 user prompt 中拼装任务类 ID 列表和 renderStateSummary,改为依赖 msg2 规划工作区;Chat 粗排判断从"上下文有任务类 ID"改为"批量调度需求" - Deliver prompt 新增 IsAborted/IsExhaustedTerminal 区分,支持粗排收口和主动终止场景 2. Execute ReAct 上下文简化——移除归档搬运、窗口裁剪和重复工具压缩 - 移除 splitExecuteLoopRecordsByBoundary、findLatestExecuteBoundaryMarker、tailExecuteLoops、compressExecuteLoopObservationsByTool、buildEarlyExecuteReactSummary、trimExecuteMessage1ByBudget 等六个函数 - 移除 executeLoopWindowLimit / executeConversationTurnLimit / executeMessage1MaxRunes 等预算常量 - msg1 不再从历史中归档上一轮 ReAct 结果,只保留真实对话流(user + assistant speak),全量注入 - msg2 不再按 loop_closed / step_advanced 边界切分"归档/活跃",直接全量注入全部 ReAct Loop 记录 - token 预算由统一压缩层兜底,prompt 层不再做提前裁剪 3. 压缩层从 Execute 专属提升为全节点通用 UnifiedCompact - 删除 execute_compact.go(Execute 专属压缩文件) - 新增 unified_compact.go:UnifiedCompactInput 参数化,各节点(Plan/Chat/Deliver/Execute)构造时从自己的 NodeInput 提取公共字段,消除对 Execute 的直接依赖 - CompactionStore 接口扩展 LoadStageCompaction / SaveStageCompaction,各节点按 stageKey 独立维护压缩状态互不覆盖 - 非 4 段式消息时退化成按角色汇总统计,确保 context_token_stats 仍然刷新 4. Retry 重试机制全面下线 - dao/agent.go:saveChatHistoryCore / SaveChatHistory / SaveChatHistoryInTx 移除 retry_group_id / retry_index / retry_from_user_message_id / retry_from_assistant_message_id 四个参数,修复乱码注释 - dao/agent-cache.go:移除 ApplyRetrySeed 和 extractMessageHistoryID 两个方法 - conv/agent.go:ToEinoMessages 不再回灌 retry_* 字段到运行期上下文 - service/agentsvc/agent.go:移除 chatRetryMeta 及 resolveRetryGroupID / buildRetrySeed 等全部重试逻辑 - service/agentsvc/agent_quick_note.go:整个文件删除(retry 快速补写路径已无用) - service/events/chat_history_persist.go:移除 retry 参数传递 5. 节点层瘦身 + 可见消息逐条持久化 - agent_nodes.go 大幅简化:Chat/Plan/Execute/Deliver 节点方法移除 ToolSchema 注入、状态摘要渲染等逻辑,只做参数转发和状态落盘 - 新增 visible_message.go:persistVisibleAssistantMessage 统一处理可见 assistant speak 的实时持久化,失败仅记日志不中断主流程 - 新增 llm_debug.go:logNodeLLMContext 统一打印 LLM 上下文调试日志 - graph_run_state.go 新增 PersistVisibleMessageFunc 类型 + AgentGraphDeps.PersistVisibleMessage 字段 - service/agentsvc/agent_newagent.go 精简主循环,注入 PersistVisibleMessage 回调;agent_history.go 精简历史构建 - token_budget.go 移除 Execute 专属预算检查,统一到通用预算 前端: 1. 移除 retry 相关 UI 和类型 - agent.ts 移除 retry_group_id / retry_index / retry_total 字段及 normalize 逻辑 - AssistantPanel.vue 移除 retry 相关 UI 和交互代码(约 700 行精简) - dashboard.ts 移除 retry 相关类型定义 - AssistantView.vue 微调 2. ContextWindowMeter 压缩次数展示和数值格式优化 - 新增 formatCompactCount 工具函数,千位以上用 k 单位压缩(如 80k) - 新增压缩次数显示 3.修复了新对话发消息时,user和assistant消息被自动调换的bug 仓库:无
258 lines
8.7 KiB
Go
258 lines
8.7 KiB
Go
package agentsvc
|
||
|
||
import (
|
||
"context"
|
||
"fmt"
|
||
"log"
|
||
"sort"
|
||
"strings"
|
||
"time"
|
||
|
||
"github.com/LoveLosita/smartflow/backend/model"
|
||
"github.com/LoveLosita/smartflow/backend/pkg"
|
||
"github.com/LoveLosita/smartflow/backend/respond"
|
||
"gorm.io/gorm"
|
||
)
|
||
|
||
// GetConversationHistory 返回指定会话的聊天历史。
|
||
//
|
||
// 职责边界:
|
||
// 1. 负责会话 ID 归一化、会话归属校验,以及“先 Redis、后 DB”的读取编排;
|
||
// 2. 负责把缓存消息 / DB 记录统一转换为 API 响应 DTO;
|
||
// 3. 不负责补写会话标题,也不负责修改聊天主链路的缓存写入策略。
|
||
func (s *AgentService) GetConversationHistory(ctx context.Context, userID int, chatID string) ([]model.GetConversationHistoryItem, error) {
|
||
normalizedChatID := strings.TrimSpace(chatID)
|
||
if normalizedChatID == "" {
|
||
return nil, respond.MissingParam
|
||
}
|
||
|
||
// 1. 先做归属校验:
|
||
// 1.1 Redis 历史缓存只按 chat_id 分桶,不能单靠缓存判断用户归属;
|
||
// 1.2 因此先查会话是否属于当前用户,避免命中别人会话缓存时产生越权读取;
|
||
// 1.3 若会话不存在,统一返回 gorm.ErrRecordNotFound,交由 API 层映射为参数错误。
|
||
exists, err := s.repo.IfChatExists(ctx, userID, normalizedChatID)
|
||
if err != nil {
|
||
return nil, err
|
||
}
|
||
if !exists {
|
||
return nil, gorm.ErrRecordNotFound
|
||
}
|
||
|
||
// 2. 优先读取“会话历史视图缓存”:
|
||
// 2.1 这层缓存专门服务 conversation-history,字段口径与前端展示一致;
|
||
// 2.2 与 Agent 上下文热缓存解耦,避免为了历史多版本而拖慢首 token;
|
||
// 2.3 若命中则直接返回,miss 再回源 DB。
|
||
if s.cacheDAO != nil {
|
||
items, cacheErr := s.cacheDAO.GetConversationHistoryFromCache(ctx, userID, normalizedChatID)
|
||
if cacheErr != nil {
|
||
log.Printf("读取会话历史视图缓存失败 chat_id=%s: %v", normalizedChatID, cacheErr)
|
||
} else if conversationHistoryCacheCanServe(items) {
|
||
return items, nil
|
||
}
|
||
}
|
||
|
||
// 3. Redis miss 时回源 DB:
|
||
// 3.1 复用现有 GetUserChatHistories 读取最近 N 条历史,保证“重试版本、落库主键、创建时间”口径稳定;
|
||
// 3.2 再把 DB 结果转换成接口 DTO,作为历史视图缓存回填;
|
||
// 3.3 失败时直接上抛,由 API 层统一处理。
|
||
histories, err := s.repo.GetUserChatHistories(ctx, userID, pkg.HistoryFetchLimitByModel("worker"), normalizedChatID)
|
||
if err != nil {
|
||
return nil, err
|
||
}
|
||
|
||
items := buildConversationHistoryItemsFromDB(histories)
|
||
|
||
if s.cacheDAO != nil {
|
||
if setErr := s.cacheDAO.SetConversationHistoryToCache(ctx, userID, normalizedChatID, items); setErr != nil {
|
||
log.Printf("回填会话历史视图缓存失败 chat_id=%s: %v", normalizedChatID, setErr)
|
||
}
|
||
}
|
||
|
||
return items, nil
|
||
}
|
||
|
||
// appendConversationHistoryCacheOptimistically 把“刚生成但尚未完成 DB 持久化确认”的消息追加到历史视图缓存。
|
||
//
|
||
// 职责边界:
|
||
// 1. 只服务前端会话历史展示,不参与 Agent 上下文热缓存;
|
||
// 2. 优先复用现有历史视图缓存,miss 时再用 DB 历史做一次启动兜底;
|
||
// 3. 不保证最终权威性,最终仍以 DB 落库成功后的缓存失效与回源结果为准。
|
||
func (s *AgentService) appendConversationHistoryCacheOptimistically(
|
||
ctx context.Context,
|
||
userID int,
|
||
chatID string,
|
||
newItems ...model.GetConversationHistoryItem,
|
||
) {
|
||
if s == nil || s.cacheDAO == nil {
|
||
return
|
||
}
|
||
normalizedChatID := strings.TrimSpace(chatID)
|
||
if userID <= 0 || normalizedChatID == "" || len(newItems) == 0 {
|
||
return
|
||
}
|
||
if ctx == nil {
|
||
ctx = context.Background()
|
||
}
|
||
|
||
// 1. 优先取历史视图缓存,避免每轮乐观追加都回源 DB。
|
||
items, err := s.cacheDAO.GetConversationHistoryFromCache(ctx, userID, normalizedChatID)
|
||
if err != nil {
|
||
log.Printf("读取会话历史视图缓存失败 chat_id=%s: %v", normalizedChatID, err)
|
||
return
|
||
}
|
||
|
||
// 2. 缓存 miss 时,用当前 DB 已有历史做一次基线兜底。
|
||
// 2.1 这样即便本轮是“缓存刚被 retry 补种操作删掉”,也不会只留下最新两条消息;
|
||
// 2.2 失败策略:DB 兜底失败只记日志并跳过,不阻塞主回复流程。
|
||
if items == nil {
|
||
histories, hisErr := s.repo.GetUserChatHistories(ctx, userID, pkg.HistoryFetchLimitByModel("worker"), normalizedChatID)
|
||
if hisErr != nil {
|
||
log.Printf("乐观追加历史缓存时回源 DB 失败 chat_id=%s: %v", normalizedChatID, hisErr)
|
||
return
|
||
}
|
||
items = buildConversationHistoryItemsFromDB(histories)
|
||
}
|
||
|
||
merged := append([]model.GetConversationHistoryItem(nil), items...)
|
||
for _, item := range newItems {
|
||
merged = appendConversationHistoryItemIfMissing(merged, item)
|
||
}
|
||
sortConversationHistoryItems(merged)
|
||
|
||
if err = s.cacheDAO.SetConversationHistoryToCache(ctx, userID, normalizedChatID, merged); err != nil {
|
||
log.Printf("乐观追加会话历史视图缓存失败 chat_id=%s: %v", normalizedChatID, err)
|
||
}
|
||
}
|
||
|
||
// buildConversationHistoryItemsFromDB 把数据库聊天记录转换为接口响应。
|
||
//
|
||
// 职责边界:
|
||
// 1. 只透传 DB 已有字段,不尝试补算 reasoning_content;
|
||
// 2. message_content / role 为空时兜底为空串与 system,避免空指针影响接口;
|
||
// 3. 保持 DAO 返回的时间正序,前端可直接渲染。
|
||
func buildConversationHistoryItemsFromDB(histories []model.ChatHistory) []model.GetConversationHistoryItem {
|
||
items := make([]model.GetConversationHistoryItem, 0, len(histories))
|
||
for _, history := range histories {
|
||
content := ""
|
||
if history.MessageContent != nil {
|
||
content = strings.TrimSpace(*history.MessageContent)
|
||
}
|
||
|
||
role := "system"
|
||
if history.Role != nil {
|
||
role = normalizeConversationHistoryRole(*history.Role)
|
||
}
|
||
|
||
items = append(items, model.GetConversationHistoryItem{
|
||
ID: history.ID,
|
||
Role: role,
|
||
Content: content,
|
||
CreatedAt: history.CreatedAt,
|
||
ReasoningContent: strings.TrimSpace(derefConversationHistoryText(history.ReasoningContent)),
|
||
ReasoningDurationSeconds: history.ReasoningDurationSeconds,
|
||
})
|
||
}
|
||
return items
|
||
}
|
||
|
||
func derefConversationHistoryText(text *string) string {
|
||
if text == nil {
|
||
return ""
|
||
}
|
||
return *text
|
||
}
|
||
|
||
func normalizeConversationHistoryRole(role string) string {
|
||
switch strings.ToLower(strings.TrimSpace(role)) {
|
||
case "user":
|
||
return "user"
|
||
case "assistant":
|
||
return "assistant"
|
||
default:
|
||
return "system"
|
||
}
|
||
}
|
||
|
||
func conversationHistoryCacheCanServe(items []model.GetConversationHistoryItem) bool {
|
||
// 1. 历史接口一旦被前端用于“重试/编辑”等二次动作,消息 id 就必须稳定可追溯。
|
||
// 2. 乐观缓存里的新消息在 DB 落库前没有自增主键,若直接返回,会让前端拿到占位 id。
|
||
// 3. 因此只有“缓存里的每条消息都带稳定 DB id”时,才允许直接命中缓存;否则强制回源 DB。
|
||
for _, item := range items {
|
||
if item.ID <= 0 {
|
||
return false
|
||
}
|
||
}
|
||
return items != nil
|
||
}
|
||
|
||
func buildOptimisticConversationHistoryItem(
|
||
role string,
|
||
content string,
|
||
reasoningContent string,
|
||
reasoningDurationSeconds int,
|
||
createdAt time.Time,
|
||
) model.GetConversationHistoryItem {
|
||
item := model.GetConversationHistoryItem{
|
||
Role: normalizeConversationHistoryRole(role),
|
||
Content: strings.TrimSpace(content),
|
||
ReasoningContent: strings.TrimSpace(reasoningContent),
|
||
ReasoningDurationSeconds: reasoningDurationSeconds,
|
||
}
|
||
if !createdAt.IsZero() {
|
||
t := createdAt
|
||
item.CreatedAt = &t
|
||
}
|
||
return item
|
||
}
|
||
|
||
func appendConversationHistoryItemIfMissing(
|
||
items []model.GetConversationHistoryItem,
|
||
item model.GetConversationHistoryItem,
|
||
) []model.GetConversationHistoryItem {
|
||
targetKey := conversationHistoryItemSignature(item)
|
||
for _, existed := range items {
|
||
if conversationHistoryItemSignature(existed) == targetKey {
|
||
return items
|
||
}
|
||
}
|
||
return append(items, item)
|
||
}
|
||
|
||
func conversationHistoryItemSignature(item model.GetConversationHistoryItem) string {
|
||
if item.ID > 0 {
|
||
return fmt.Sprintf("id:%d", item.ID)
|
||
}
|
||
|
||
createdAt := ""
|
||
if item.CreatedAt != nil {
|
||
createdAt = item.CreatedAt.UTC().Format(time.RFC3339Nano)
|
||
}
|
||
|
||
return fmt.Sprintf(
|
||
"%s|%s|%s|%d|%s",
|
||
strings.TrimSpace(item.Role),
|
||
strings.TrimSpace(item.Content),
|
||
strings.TrimSpace(item.ReasoningContent),
|
||
item.ReasoningDurationSeconds,
|
||
createdAt,
|
||
)
|
||
}
|
||
|
||
func sortConversationHistoryItems(items []model.GetConversationHistoryItem) {
|
||
sort.SliceStable(items, func(i, j int) bool {
|
||
left := conversationHistoryTimestamp(items[i])
|
||
right := conversationHistoryTimestamp(items[j])
|
||
if left.Equal(right) {
|
||
return conversationHistoryItemSignature(items[i]) < conversationHistoryItemSignature(items[j])
|
||
}
|
||
return left.Before(right)
|
||
})
|
||
}
|
||
|
||
func conversationHistoryTimestamp(item model.GetConversationHistoryItem) time.Time {
|
||
if item.CreatedAt == nil {
|
||
return time.Time{}
|
||
}
|
||
return *item.CreatedAt
|
||
}
|