后端: 1. 品牌文案与聊天定位统一切到 SmartMate,并放宽非排程问答能力 - 系统人设、路由、排程、查询、交付提示统一从 SmartFlow 改为 SmartMate - 明确普通问答/生活建议/开放讨论可正常回答,deep_answer 不再输出“让我想想”等占位话术 - thinkingMode=auto 时,deep_answer 默认开启 thinking,execute 继续跟随路由决策,其余路由默认关闭 2. Memory 读取链路升级为“结构化强约束 + 语义候选”hybrid 模式,并补齐注入渲染 / Execute 消费 - 新增 read.mode、四类记忆预算、inject.renderMode 等配置及默认值 - 落地 HybridRetrieve,统一 MySQL/RAG 读侧作用域、三级去重(ID/hash/text)、统一重排与按类型预算裁剪 - 新增 FindPinnedByUser、content_hash DTO/兜底补算、legacy/RAG 共用读侧查询口径与 fallback 逻辑 - 记忆注入支持 flat/typed_v2 两种渲染,execute msg3 正式消费 memory_context,主链路注入 MemoryReader 时同步透传 memory 配置 3. Memory 第二步/第三步 handoff 与治理文档补齐 - HANDOFF_Memory向Mem0靠拢三步冲刺计划.md 从 newAgent 迁到 memory 目录,并补充“我的记忆”增删改查与最小留痕口径 - 新增 backend/memory/记忆模块第二步计划.md、backend/memory/第三步治理与观测落地计划.md,分别拆解 hybrid 读取注入闭环与治理/观测/清理路线 - 同步更新 backend/memory/Log.txt 调试日志 前端: 1. 助手输入区新增“智能编排”任务类选择器,并把 task_class_ids 作为请求 extra 透传 - 新建 frontend/src/components/assistant/TaskClassPlanningPicker.vue,支持拉取任务类列表、临时勾选、已选标签回显与清空 - 更新 frontend/src/components/dashboard/AssistantPanel.vue、frontend/src/types/dashboard.ts:Chat extra 正式建模 task_class_ids / retry 字段;当本轮带编排任务类时强制新起会话,避免把现有会话历史误混入新编排 2. 会话上下文窗口统计接入前端展示 - 更新 frontend/src/api/agent.ts、新建 frontend/src/components/assistant/ContextWindowMeter.vue、更新 frontend/src/components/dashboard/AssistantPanel.vue、frontend/src/types/dashboard.ts:接入 /agent/context-stats,兼容 object/string/null 三种返回;在输入工具栏展示 msg0~msg3 占比与预算使用率 3. 助手面板交互细节优化 - 更新 frontend/src/components/dashboard/AssistantPanel.vue:thinking 开关改为 auto/true/false 三态选择;切会话与重试后同步刷新 context stats;历史列表首屏不足时自动继续分页直到形成滚动区 仓库:无
84 lines
3.3 KiB
Go
84 lines
3.3 KiB
Go
package service
|
||
|
||
import (
|
||
"time"
|
||
|
||
infrarag "github.com/LoveLosita/smartflow/backend/infra/rag"
|
||
memorymodel "github.com/LoveLosita/smartflow/backend/memory/model"
|
||
)
|
||
|
||
// buildReadScopedItemQuery 构造读侧统一使用的 MySQL 查询条件。
|
||
//
|
||
// 职责边界:
|
||
// 1. 只负责把 RetrieveRequest 映射成“读侧作用域”查询参数;
|
||
// 2. 不负责真正查库,也不负责排序、裁剪或注入;
|
||
// 3. conversation_id 字段在这里刻意不参与过滤,仅保留在记忆记录元数据里供审计与溯源使用。
|
||
//
|
||
// 步骤化说明:
|
||
// 1. 读侧始终按 user_id 作为硬隔离边界,避免跨用户串记忆。
|
||
// 2. assistant_id / run_id 仍允许参与过滤,因为它们表达的是助手实例与执行轮次边界,而不是“是否跨对话召回”的问题。
|
||
// 3. conversation_id 明确置空,原因是聊天上下文窗口已经覆盖同对话信息;记忆读侧的价值主要在跨对话补充。
|
||
func buildReadScopedItemQuery(
|
||
req memorymodel.RetrieveRequest,
|
||
now time.Time,
|
||
statuses []string,
|
||
limit int,
|
||
) memorymodel.ItemQuery {
|
||
return memorymodel.ItemQuery{
|
||
UserID: req.UserID,
|
||
ConversationID: "",
|
||
AssistantID: req.AssistantID,
|
||
RunID: req.RunID,
|
||
Statuses: statuses,
|
||
MemoryTypes: normalizeRetrieveMemoryTypes(req.MemoryTypes),
|
||
IncludeGlobal: true,
|
||
OnlyUnexpired: true,
|
||
Limit: limit,
|
||
Now: now,
|
||
}
|
||
}
|
||
|
||
// buildReadScopedRAGRequest 构造读侧统一使用的 RAG 检索请求。
|
||
//
|
||
// 职责边界:
|
||
// 1. 只负责生成 memory 检索请求,不负责执行向量检索;
|
||
// 2. 不负责阈值外的重排、fallback 或去重;
|
||
// 3. conversation_id 字段同样只保留在文档 metadata 中,不再作为聊天读侧的硬过滤条件。
|
||
//
|
||
// 步骤化说明:
|
||
// 1. user_id 仍是唯一必须保留的硬过滤条件,确保召回范围限定在当前用户。
|
||
// 2. conversation_id 明确置空,避免旧对话记忆在进入相似度计算前就被 metadata filter 提前挡掉。
|
||
// 3. assistant_id / run_id 保持透传,方便后续若存在多助手场景时继续做更细粒度隔离。
|
||
func buildReadScopedRAGRequest(
|
||
req memorymodel.RetrieveRequest,
|
||
topK int,
|
||
threshold float64,
|
||
) infrarag.MemoryRetrieveRequest {
|
||
return infrarag.MemoryRetrieveRequest{
|
||
Query: req.Query,
|
||
TopK: topK,
|
||
Threshold: threshold,
|
||
Action: "search",
|
||
UserID: req.UserID,
|
||
ConversationID: "",
|
||
AssistantID: req.AssistantID,
|
||
RunID: req.RunID,
|
||
MemoryTypes: normalizeRetrieveMemoryTypes(req.MemoryTypes),
|
||
}
|
||
}
|
||
|
||
// shouldReturnSemanticRAGResult 判断当前是否可以直接采用 RAG 结果。
|
||
//
|
||
// 职责边界:
|
||
// 1. 只负责表达“RAG 是否足以短路后续 MySQL fallback”这一条业务规则;
|
||
// 2. 不负责执行任何检索,也不负责日志记录;
|
||
// 3. 返回 false 不代表错误,只代表调用方应继续尝试数据库兜底。
|
||
//
|
||
// 步骤化说明:
|
||
// 1. RAG 报错时,一定不能短路,必须继续走 MySQL fallback。
|
||
// 2. RAG 0 命中时,同样不能短路;否则会把“成功执行但没有候选”误当成最终结果。
|
||
// 3. 只有“无报错且结果非空”时,才允许直接返回 RAG 结果。
|
||
func shouldReturnSemanticRAGResult(items []memorymodel.ItemDTO, err error) bool {
|
||
return err == nil && len(items) > 0
|
||
}
|