Version: 0.9.22.dev.260416
后端: 1. 品牌文案与聊天定位统一切到 SmartMate,并放宽非排程问答能力 - 系统人设、路由、排程、查询、交付提示统一从 SmartFlow 改为 SmartMate - 明确普通问答/生活建议/开放讨论可正常回答,deep_answer 不再输出“让我想想”等占位话术 - thinkingMode=auto 时,deep_answer 默认开启 thinking,execute 继续跟随路由决策,其余路由默认关闭 2. Memory 读取链路升级为“结构化强约束 + 语义候选”hybrid 模式,并补齐注入渲染 / Execute 消费 - 新增 read.mode、四类记忆预算、inject.renderMode 等配置及默认值 - 落地 HybridRetrieve,统一 MySQL/RAG 读侧作用域、三级去重(ID/hash/text)、统一重排与按类型预算裁剪 - 新增 FindPinnedByUser、content_hash DTO/兜底补算、legacy/RAG 共用读侧查询口径与 fallback 逻辑 - 记忆注入支持 flat/typed_v2 两种渲染,execute msg3 正式消费 memory_context,主链路注入 MemoryReader 时同步透传 memory 配置 3. Memory 第二步/第三步 handoff 与治理文档补齐 - HANDOFF_Memory向Mem0靠拢三步冲刺计划.md 从 newAgent 迁到 memory 目录,并补充“我的记忆”增删改查与最小留痕口径 - 新增 backend/memory/记忆模块第二步计划.md、backend/memory/第三步治理与观测落地计划.md,分别拆解 hybrid 读取注入闭环与治理/观测/清理路线 - 同步更新 backend/memory/Log.txt 调试日志 前端: 1. 助手输入区新增“智能编排”任务类选择器,并把 task_class_ids 作为请求 extra 透传 - 新建 frontend/src/components/assistant/TaskClassPlanningPicker.vue,支持拉取任务类列表、临时勾选、已选标签回显与清空 - 更新 frontend/src/components/dashboard/AssistantPanel.vue、frontend/src/types/dashboard.ts:Chat extra 正式建模 task_class_ids / retry 字段;当本轮带编排任务类时强制新起会话,避免把现有会话历史误混入新编排 2. 会话上下文窗口统计接入前端展示 - 更新 frontend/src/api/agent.ts、新建 frontend/src/components/assistant/ContextWindowMeter.vue、更新 frontend/src/components/dashboard/AssistantPanel.vue、frontend/src/types/dashboard.ts:接入 /agent/context-stats,兼容 object/string/null 三种返回;在输入工具栏展示 msg0~msg3 占比与预算使用率 3. 助手面板交互细节优化 - 更新 frontend/src/components/dashboard/AssistantPanel.vue:thinking 开关改为 auto/true/false 三态选择;切会话与重试后同步刷新 context stats;历史列表首屏不足时自动继续分页直到形成滚动区 仓库:无
This commit is contained in:
@@ -1,12 +1,20 @@
|
||||
# 应用配置文件示例
|
||||
# 包含服务器、数据库等基础配置
|
||||
# 请根据实际情况修改并保存为 config.yaml
|
||||
# SmartFlow 后端配置示例
|
||||
#
|
||||
# 使用说明:
|
||||
# 1. 请复制为 config.yaml 后再按实际环境填写。
|
||||
# 2. 示例文件强调“结构清晰”和“字段语义明确”,不是生产推荐值。
|
||||
# 3. 若你只想看 memory 相关配置,优先看本文件下半部分的 memory / rag / websearch 段。
|
||||
|
||||
# 服务启动与 HTTP 行为。
|
||||
server:
|
||||
# HTTP 监听端口。
|
||||
port: 8080
|
||||
# gin 运行模式:debug / release。
|
||||
mode: debug
|
||||
# 单次请求默认超时时间。
|
||||
timeout: 30s
|
||||
|
||||
# MySQL 主库配置。
|
||||
database:
|
||||
host: localhost
|
||||
port: 3306
|
||||
@@ -17,22 +25,28 @@ database:
|
||||
parseTime: true
|
||||
loc: Local
|
||||
|
||||
# 登录态与鉴权令牌配置。
|
||||
jwt:
|
||||
accessSecret: "put_your_jwt_access_secret_here"
|
||||
refreshSecret: "put_your_jwt_refresh_secret_here"
|
||||
# access token 有效期,面向接口鉴权。
|
||||
accessTokenExpire: 15min
|
||||
# refresh token 有效期,面向续签。
|
||||
refreshTokenExpire: 7d
|
||||
|
||||
# 应用日志输出配置。
|
||||
log:
|
||||
level: info
|
||||
path: logs/
|
||||
|
||||
# Redis 缓存与轻量状态存储。
|
||||
redis:
|
||||
host: localhost
|
||||
port: 6379
|
||||
password: ""
|
||||
db: 0
|
||||
|
||||
# Kafka outbox 事件总线配置。
|
||||
kafka:
|
||||
enabled: true
|
||||
brokers:
|
||||
@@ -43,75 +57,148 @@ kafka:
|
||||
retryBatchSize: 100
|
||||
maxRetry: 20
|
||||
|
||||
# 时间与学期边界配置。
|
||||
time:
|
||||
zone: "Asia/Shanghai"
|
||||
semesterStartDate: "2026-03-02" #学期开始日期,一定要设定为周一,以便于计算周数
|
||||
semesterEndDate: "2026-07-19" #学期结束日期,一定要设定为周日,确保最后一周完整
|
||||
zone: "Asia/Shanghai"
|
||||
# 学期开始日期,一定要设定为周一,以便于计算周数。
|
||||
semesterStartDate: "2026-03-02"
|
||||
# 学期结束日期,一定要设定为周日,确保最后一周完整。
|
||||
semesterEndDate: "2026-07-19"
|
||||
|
||||
# 智能体模型与规划参数。
|
||||
agent:
|
||||
workerModel: "doubao-seed-2-0-code-preview-260215" # 智能体使用的Worker模型,需根据实际情况调整
|
||||
strategistModel: "doubao-seed-2-0-code-preview-260215" # 策略师使用的Worker模型,需根据实际情况调整
|
||||
baseURL: "https://ark.cn-beijing.volces.com/api/v3" # Worker服务的基础URL,需根据实际情况调整
|
||||
dailyRefineConcurrency: 7 # 日内并发优化并发度,建议按模型配额调整
|
||||
weeklyAdjustBudget: 5 # 周级跨天配平额度上限,防止过度调整
|
||||
# 日常执行链路使用的主模型。
|
||||
workerModel: "doubao-seed-2-0-code-preview-260215"
|
||||
# 规划、拆解、策略推导使用的模型。
|
||||
strategistModel: "doubao-seed-2-0-code-preview-260215"
|
||||
# 模型服务根路径。
|
||||
baseURL: "https://ark.cn-beijing.volces.com/api/v3"
|
||||
# 日内并发优化并发度,建议按模型配额调整。
|
||||
dailyRefineConcurrency: 7
|
||||
# 周级跨天配平额度上限,防止过度调整。
|
||||
weeklyAdjustBudget: 5
|
||||
|
||||
# 通用 RAG 配置。
|
||||
rag:
|
||||
# 总开关;关闭后不再走通用向量检索链路。
|
||||
enabled: true
|
||||
store: "milvus" # 可选:inmemory / milvus
|
||||
# 当前向量存储类型,可选:inmemory / milvus。
|
||||
store: "milvus"
|
||||
# 召回候选上限。
|
||||
topK: 8
|
||||
# 召回相似度阈值。
|
||||
threshold: 0.55
|
||||
retrieve:
|
||||
# 单次检索超时时间,避免主链路长时间阻塞。
|
||||
timeoutMs: 1500
|
||||
ingest:
|
||||
# 文档切块大小;过大影响召回精度,过小影响上下文完整度。
|
||||
chunkSize: 400
|
||||
# 相邻 chunk 重叠字符数。
|
||||
chunkOverlap: 80
|
||||
embed:
|
||||
provider: "eino" # 可选:mock / eino
|
||||
model: "doubao-embedding-vision-251215" # 例如 Ark/OpenAI 兼容 embedding 模型名
|
||||
baseURL: "https://ark.cn-beijing.volces.com/api/v3" # 这里填服务根路径,SDK 会自动拼接 /embeddings;API Key 统一从环境变量 ARK_API_KEY 读取
|
||||
# embedding 供应商实现,可选:mock / eino。
|
||||
provider: "eino"
|
||||
# embedding 模型名。
|
||||
model: "doubao-embedding-vision-251215"
|
||||
# embedding 服务根路径;API Key 统一从环境变量读取。
|
||||
baseURL: "https://ark.cn-beijing.volces.com/api/v3"
|
||||
timeoutMs: 1200
|
||||
# 向量维度,必须与向量库 collection 配置一致。
|
||||
dimension: 1024
|
||||
reranker:
|
||||
# 是否启用重排。
|
||||
enabled: false
|
||||
provider: "noop" # 当前默认 noop,后续可扩展
|
||||
# 当前默认 noop,后续可扩展。
|
||||
provider: "noop"
|
||||
milvus:
|
||||
address: "http://localhost:19530" # Milvus REST 入口,当前联调确认不要填 9091 健康检查口
|
||||
# Milvus REST 地址,不要填健康检查口。
|
||||
address: "http://localhost:19530"
|
||||
token: "root:Milvus"
|
||||
dbName: ""
|
||||
# 通用 RAG chunk collection。
|
||||
collectionName: "smartflow_rag_chunks"
|
||||
metricType: "COSINE"
|
||||
requestTimeoutMs: 1500
|
||||
|
||||
# 记忆模块配置。
|
||||
memory:
|
||||
# memory 总开关;关闭后不做抽取、写入、召回、注入。
|
||||
enabled: true
|
||||
rag:
|
||||
# 是否允许 memory 读写链路使用向量召回能力。
|
||||
# 关闭后,memory 里的“语义候选”会退回 MySQL 路径,不等于整个 memory 模块关闭。
|
||||
enabled: true
|
||||
read:
|
||||
# 读取模式:
|
||||
# 1. legacy:旧读链路,语义上是“RAG 优先,失败再走 legacy”。
|
||||
# 2. hybrid:新读链路,先取强约束,再补语义候选,再统一去重/排序/预算裁剪。
|
||||
# 3. 如果你想强制纯 MySQL 召回,建议同时设置 read.mode=legacy 且 memory.rag.enabled=false。
|
||||
mode: legacy
|
||||
# constraint 类型最大注入条数。
|
||||
constraintLimit: 5
|
||||
# preference 类型最大注入条数。
|
||||
preferenceLimit: 5
|
||||
# fact 类型最大注入条数。
|
||||
factLimit: 5
|
||||
# todo_hint 类型最大注入条数。
|
||||
todoHintLimit: 3
|
||||
inject:
|
||||
# 注入渲染模式:
|
||||
# flat 为旧扁平列表;typed_v2 为按类型分段,便于模型区分“硬约束”和“参考事实”。
|
||||
renderMode: flat
|
||||
prompt:
|
||||
# 留空表示走代码内默认抽取 prompt。
|
||||
extract: ""
|
||||
# 留空表示走代码内默认决策 prompt。
|
||||
decision: ""
|
||||
# memory 向量召回阈值。
|
||||
threshold: 0.55
|
||||
# 是否启用重排;当前默认关闭。
|
||||
enableReranker: false
|
||||
llm:
|
||||
# 记忆抽取/决策使用的 LLM 随机度,默认尽量保守,提升可复现性。
|
||||
temperature: 0.1
|
||||
topP: 0.2
|
||||
job:
|
||||
# 异步记忆任务最大重试次数。
|
||||
maxRetry: 6
|
||||
worker:
|
||||
# worker 轮询间隔。
|
||||
pollEvery: 2s
|
||||
# 单次认领任务数。
|
||||
claimBatch: 1
|
||||
decision:
|
||||
enabled: false # 决策层总开关,默认关闭。开启后写入链路走"召回→比对→汇总"流程
|
||||
candidateTopK: 5 # Milvus 语义召回候选数上限
|
||||
candidateMinScore: 0.6 # Milvus 语义召回最低相似度阈值
|
||||
fallbackMode: legacy_add # 决策流程整体失败时的降级策略:legacy_add(退回旧路径)/ drop(丢弃)
|
||||
write:
|
||||
mode: legacy # 写入模式:legacy(旧路径)/ decision(决策流程),仅 decision.enabled=true 时生效
|
||||
|
||||
websearch:
|
||||
provider: bocha # 可选:mock | bocha(mock 为空实现,跑通链路用)
|
||||
apiKey: "" # 搜索供应商 API Key(bocha 模式必填,否则降级为 mock)
|
||||
timeout: 10s # 单次搜索请求超时
|
||||
fetchTimeout: 15s # 单次 URL 抓取超时
|
||||
fetchMaxChars: 4000 # 抓取正文最大字符数
|
||||
rag:
|
||||
# 决策层总开关。
|
||||
# 开启后,写入链路会从“直接新增”升级成“召回旧记忆 -> 比对 -> 决策动作”。
|
||||
enabled: false
|
||||
# 决策层语义候选数上限。
|
||||
candidateTopK: 5
|
||||
# 决策层语义候选最低相似度阈值。
|
||||
candidateMinScore: 0.6
|
||||
# 决策流程整体失败时的降级策略:
|
||||
# legacy_add:退回旧路径直接新增
|
||||
# drop:直接丢弃本次写入
|
||||
fallbackMode: legacy_add
|
||||
write:
|
||||
# 写入模式:
|
||||
# legacy:沿用旧写入路径
|
||||
# decision:启用决策式写入
|
||||
# 注意:只有 decision.enabled=true 时,这个值才真正生效。
|
||||
mode: legacy
|
||||
|
||||
# 联网搜索能力配置。
|
||||
websearch:
|
||||
# 可选:mock | bocha。
|
||||
provider: bocha
|
||||
# 搜索供应商 API Key;bocha 模式必填,否则会降级为 mock。
|
||||
apiKey: ""
|
||||
# 单次搜索请求超时。
|
||||
timeout: 10s
|
||||
# 单次 URL 抓取超时。
|
||||
fetchTimeout: 15s
|
||||
# 抓取正文最大字符数。
|
||||
fetchMaxChars: 4000
|
||||
rag:
|
||||
# 是否把 websearch 结果继续送入 RAG 处理。
|
||||
enabled: false
|
||||
|
||||
Reference in New Issue
Block a user