Files

LoveLosita fae162162a Version: 0.9.13.dev.260410

后端：
1. Memory Day1 链路打通（chat_history -> outbox -> memory_jobs）
   - 更新 service/events/chat_history_persist.go：聊天消息落库同事务追加 memory.extract.requested 事件（仅 user 消息，失败回滚后由 outbox 重试）
   - 新建 service/events/memory_extract_requested.go：消费 memory.extract.requested 并幂等入队 memory_jobs，补齐 payload 校验、文本截断与 idempotency key
   - 更新 cmd/start.go：注册 RegisterMemoryExtractRequestedHandler
2. Memory 模块骨架落地（先跑通状态机，再接入真实抽取）
   - 新建 memory/model、repo、service、orchestrator、worker、utils 目录与 Day1 mock 抽取执行链
   - 新建 model/memory.go：补齐 memory_items / memory_jobs / memory_audit_logs / memory_user_settings 与事件 payload 模型
   - 更新 inits/mysql.go：接入 4 张 memory 相关表 AutoMigrate
3. RAG 复用基础设施预埋（依赖可替换）
   - 新建 infra/rag：core pipeline + chunk/embed/retrieve/rerank/store/corpus/config 分层实现
   - 默认接入 MockEmbedder + InMemoryStore，预留 Milvus / Eino 适配实现
   - 新增 infra/rag/RAG复用接口实施计划.md
4. 本地依赖与交接文档同步
   - 更新 docker-compose.yml：新增 etcd / minio / milvus / attu 服务与数据卷
   - 删除 newAgent/HANDOFF_工具研究与运行态重置.md、newAgent/阶段3_上下文瘦身设计.md
   - 新增 newAgent/HANDOFF_WebSearch两阶段实施计划.md、memory/HANDOFF-RAG复用后续实施计划.md、memory/README.md
前端：无 仓库：无

2026-04-10 13:07:54 +08:00

5.4 KiB

Raw Blame History

WebSearch 两阶段实施计划（newAgent）

1. 目标与范围

本文用于把 newAgent 的 WebSearch 能力按两阶段落地：

第一阶段：先接入可用的检索与抓取能力（低风险、快交付）。
第二阶段：在第一阶段基础上升级为 WebRAG 语义召回链路（提升复杂问题命中率与可解释性）。

约束：

不走 infra/smartflow-mcp-server，直接走 newAgent/tools 工具注册链路。
保持现有执行模式不变：读操作 action=continue + tool_call。
第一阶段只接单供应商；第二阶段再考虑 provider fallback。

2. 第一阶段（V1）：WebSearch + 简单抓取

2.1 交付目标

让模型可以：

通过 web_search 获得结构化检索结果（标题、摘要、URL、来源域名、时间）。
通过 web_fetch 拉取指定 URL 正文并做最小清洗。
在不改主流程的前提下，把结果作为标准 tool observation 写回历史。

2.2 计划新增工具

web_search
- 输入：query、top_k、domain_allow、recency_days 等。
- 输出：JSON 字符串（tool、query、count、items[]）。
web_fetch
- 输入：url、max_chars。
- 输出：JSON 字符串（tool、url、title、content、truncated）。

2.3 代码落点

新增文件：

backend/newAgent/tools/web_tools.go：工具参数解析、输出组装、错误兜底。
backend/newAgent/tools/web_provider.go：搜索供应商抽象接口与通用数据结构。
backend/newAgent/tools/web_provider_tavily.go（或 web_provider_brave.go）：首个 provider 实现。
backend/newAgent/tools/web_fetcher.go：URL 抓取与 HTML 最小清洗。

修改文件：

backend/newAgent/tools/registry.go：注册 web_search、web_fetch 两个读工具。
backend/cmd/start.go：初始化 provider 配置并注入 registry（或通过包级配置读取）。
backend/newAgent/prompt/execute_context.go：补充新工具的 schema 说明与示例。

2.4 V1 验收标准

模型能稳定调用 web_search 并拿到可解析 JSON 结果。
web_fetch 在正文可达时返回正文，在失败时返回明确错误码与原因。
工具超时、429、5xx 均不会打断主流程，只返回可恢复 observation。
日志可定位：query、tool、耗时、结果数、失败原因。

3. 第二阶段（V2）：WebRAG 语义召回

3.1 交付目标

新增 web_rag_search，把“检索 + 抓取 + 分块 + 召回 + 重排 + 证据返回”收敛为一个读工具，提升复杂问答质量。

3.2 链路设计

查询改写：把用户问题改写为 1~3 个检索子查询。
WebSearch 召回：拿到候选 URL 集合。
抓取清洗：抽正文，去噪。
分块：按段落与 token 预算切块。
召回：向量召回 + 关键词召回（混合召回）。
重排：按 query 相关性重排 chunk。
输出：返回答案所需证据片段、来源 URL、片段得分。

3.3 代码落点