后端: 1. 品牌文案与聊天定位统一切到 SmartMate,并放宽非排程问答能力 - 系统人设、路由、排程、查询、交付提示统一从 SmartFlow 改为 SmartMate - 明确普通问答/生活建议/开放讨论可正常回答,deep_answer 不再输出“让我想想”等占位话术 - thinkingMode=auto 时,deep_answer 默认开启 thinking,execute 继续跟随路由决策,其余路由默认关闭 2. Memory 读取链路升级为“结构化强约束 + 语义候选”hybrid 模式,并补齐注入渲染 / Execute 消费 - 新增 read.mode、四类记忆预算、inject.renderMode 等配置及默认值 - 落地 HybridRetrieve,统一 MySQL/RAG 读侧作用域、三级去重(ID/hash/text)、统一重排与按类型预算裁剪 - 新增 FindPinnedByUser、content_hash DTO/兜底补算、legacy/RAG 共用读侧查询口径与 fallback 逻辑 - 记忆注入支持 flat/typed_v2 两种渲染,execute msg3 正式消费 memory_context,主链路注入 MemoryReader 时同步透传 memory 配置 3. Memory 第二步/第三步 handoff 与治理文档补齐 - HANDOFF_Memory向Mem0靠拢三步冲刺计划.md 从 newAgent 迁到 memory 目录,并补充“我的记忆”增删改查与最小留痕口径 - 新增 backend/memory/记忆模块第二步计划.md、backend/memory/第三步治理与观测落地计划.md,分别拆解 hybrid 读取注入闭环与治理/观测/清理路线 - 同步更新 backend/memory/Log.txt 调试日志 前端: 1. 助手输入区新增“智能编排”任务类选择器,并把 task_class_ids 作为请求 extra 透传 - 新建 frontend/src/components/assistant/TaskClassPlanningPicker.vue,支持拉取任务类列表、临时勾选、已选标签回显与清空 - 更新 frontend/src/components/dashboard/AssistantPanel.vue、frontend/src/types/dashboard.ts:Chat extra 正式建模 task_class_ids / retry 字段;当本轮带编排任务类时强制新起会话,避免把现有会话历史误混入新编排 2. 会话上下文窗口统计接入前端展示 - 更新 frontend/src/api/agent.ts、新建 frontend/src/components/assistant/ContextWindowMeter.vue、更新 frontend/src/components/dashboard/AssistantPanel.vue、frontend/src/types/dashboard.ts:接入 /agent/context-stats,兼容 object/string/null 三种返回;在输入工具栏展示 msg0~msg3 占比与预算使用率 3. 助手面板交互细节优化 - 更新 frontend/src/components/dashboard/AssistantPanel.vue:thinking 开关改为 auto/true/false 三态选择;切会话与重试后同步刷新 context stats;历史列表首屏不足时自动继续分页直到形成滚动区 仓库:无
134 lines
4.2 KiB
Go
134 lines
4.2 KiB
Go
package model
|
||
|
||
import (
|
||
"strings"
|
||
"time"
|
||
)
|
||
|
||
const (
|
||
// MemoryReadModeLegacy 表示读取侧沿用“RAG 优先,失败再走 legacy”旧链路。
|
||
MemoryReadModeLegacy = "legacy"
|
||
// MemoryReadModeHybrid 表示读取侧走“结构化强约束 + 语义候选”混合链路。
|
||
MemoryReadModeHybrid = "hybrid"
|
||
|
||
// MemoryInjectRenderModeFlat 表示沿用扁平列表渲染。
|
||
MemoryInjectRenderModeFlat = "flat"
|
||
// MemoryInjectRenderModeTypedV2 表示按记忆类型分段渲染。
|
||
MemoryInjectRenderModeTypedV2 = "typed_v2"
|
||
|
||
// DefaultReadConstraintLimit 是 constraint 默认预算上限。
|
||
DefaultReadConstraintLimit = 5
|
||
// DefaultReadPreferenceLimit 是 preference 默认预算上限。
|
||
DefaultReadPreferenceLimit = 5
|
||
// DefaultReadFactLimit 是 fact 默认预算上限。
|
||
DefaultReadFactLimit = 5
|
||
// DefaultReadTodoHintLimit 是 todo_hint 默认预算上限。
|
||
DefaultReadTodoHintLimit = 3
|
||
)
|
||
|
||
// Config 是记忆模块配置对象(Day1 首版)。
|
||
//
|
||
// 职责边界:
|
||
// 1. 只承载模块运行参数,不承载业务状态;
|
||
// 2. 允许启动期统一注入,避免业务层直接依赖配置中心。
|
||
type Config struct {
|
||
Enabled bool
|
||
RAGEnabled bool
|
||
|
||
ReadMode string
|
||
ReadConstraintLimit int
|
||
ReadPreferenceLimit int
|
||
ReadFactLimit int
|
||
ReadTodoHintLimit int
|
||
InjectRenderMode string
|
||
|
||
ExtractPrompt string
|
||
DecisionPrompt string
|
||
|
||
Threshold float64
|
||
EnableReranker bool
|
||
|
||
LLMTemperature float64
|
||
LLMTopP float64
|
||
|
||
JobMaxRetry int
|
||
WorkerPollEvery time.Duration
|
||
WorkerClaimBatch int
|
||
|
||
// 决策层配置。
|
||
// 说明:
|
||
// 1. DecisionEnabled 控制是否启用"召回→比对→汇总"决策流程;
|
||
// 2. 默认关闭,旧路径完全保留,回滚无风险;
|
||
// 3. DecisionFallbackMode 仅在决策流程整体报错时生效,不影响单条 LLM 比对失败(单条失败视为 unrelated)。
|
||
DecisionEnabled bool
|
||
DecisionCandidateTopK int // Milvus 语义召回候选数上限
|
||
DecisionCandidateMinScore float64 // Milvus 语义召回最低相似度
|
||
DecisionFallbackMode string // "legacy_add"(退回旧路径直接新增)/ "drop"(丢弃)
|
||
WriteMode string // "legacy"(旧路径)/ "decision"(决策流程),仅 DecisionEnabled=true 时生效
|
||
}
|
||
|
||
// NormalizeReadMode 统一读取模式字符串。
|
||
func NormalizeReadMode(mode string) string {
|
||
switch strings.ToLower(strings.TrimSpace(mode)) {
|
||
case MemoryReadModeHybrid:
|
||
return MemoryReadModeHybrid
|
||
default:
|
||
return MemoryReadModeLegacy
|
||
}
|
||
}
|
||
|
||
// NormalizeInjectRenderMode 统一注入渲染模式字符串。
|
||
func NormalizeInjectRenderMode(mode string) string {
|
||
switch strings.ToLower(strings.TrimSpace(mode)) {
|
||
case MemoryInjectRenderModeTypedV2:
|
||
return MemoryInjectRenderModeTypedV2
|
||
default:
|
||
return MemoryInjectRenderModeFlat
|
||
}
|
||
}
|
||
|
||
// EffectiveReadConstraintLimit 返回 constraint 生效预算。
|
||
func (c Config) EffectiveReadConstraintLimit() int {
|
||
return normalizePositiveLimit(c.ReadConstraintLimit, DefaultReadConstraintLimit)
|
||
}
|
||
|
||
// EffectiveReadPreferenceLimit 返回 preference 生效预算。
|
||
func (c Config) EffectiveReadPreferenceLimit() int {
|
||
return normalizePositiveLimit(c.ReadPreferenceLimit, DefaultReadPreferenceLimit)
|
||
}
|
||
|
||
// EffectiveReadFactLimit 返回 fact 生效预算。
|
||
func (c Config) EffectiveReadFactLimit() int {
|
||
return normalizePositiveLimit(c.ReadFactLimit, DefaultReadFactLimit)
|
||
}
|
||
|
||
// EffectiveReadTodoHintLimit 返回 todo_hint 生效预算。
|
||
func (c Config) EffectiveReadTodoHintLimit() int {
|
||
return normalizePositiveLimit(c.ReadTodoHintLimit, DefaultReadTodoHintLimit)
|
||
}
|
||
|
||
// EffectiveReadMode 返回生效读取模式。
|
||
func (c Config) EffectiveReadMode() string {
|
||
return NormalizeReadMode(c.ReadMode)
|
||
}
|
||
|
||
// EffectiveInjectRenderMode 返回生效渲染模式。
|
||
func (c Config) EffectiveInjectRenderMode() string {
|
||
return NormalizeInjectRenderMode(c.InjectRenderMode)
|
||
}
|
||
|
||
// TotalReadBudget 返回四类记忆的总预算上限。
|
||
func (c Config) TotalReadBudget() int {
|
||
return c.EffectiveReadConstraintLimit() +
|
||
c.EffectiveReadPreferenceLimit() +
|
||
c.EffectiveReadFactLimit() +
|
||
c.EffectiveReadTodoHintLimit()
|
||
}
|
||
|
||
func normalizePositiveLimit(value int, defaultValue int) int {
|
||
if value <= 0 {
|
||
return defaultValue
|
||
}
|
||
return value
|
||
}
|