LoveLosita
|
4906f814fd
|
Version: 0.4.6.dev.260307
feat: 🎯 新增 Token 估算与裁剪工具
* 在 `backend/pkg/token_budget.go` 中新增 Token 估算与裁剪工具
* 最大上下文 Token 数量设置为 224000,预留冗余 28000
* 从最旧消息开始裁剪,直到历史 Token 数量低于预算
* 根据裁剪后的历史消息数量动态计算 Redis 动态窗口大小
refactor: ♻️ 接入 Token 裁剪至 Service 主流程
* 在 `backend/service/agent.go` 中接入 Token 裁剪逻辑
* 先从历史数据获取(缓存未命中则查询数据库)
* 按 Token 预算裁剪历史消息,裁剪后再喂模型
* 根据裁剪结果动态调整 Redis 会话窗口
refactor: ♻️ 改造 Redis 历史队列为会话级动态窗口
* 在 `backend/dao/agent-cache.go` 中新增 `SetSessionWindowSize` 与 `EnforceHistoryWindow`
* `PushMessage` 和 `BackfillHistory` 方法使用会话动态窗口,而非固定 20 条历史消息
* 默认窗口大小提升至 128,但会被会话动态窗口值覆盖
|
2026-03-07 16:37:07 +08:00 |
|
LoveLosita
|
26c350f378
|
Version: 0.4.4.dev.260307
feat: 🚀 增强会话管理与缓存机制
* 会话 ID 空值兜底,若 `conversation_id` 为空时自动生成 UUID
* 在响应头写入 `X-Conversation-ID`,供前端使用,保持同一会话状态
perf: ⚡ 会话状态缓存优化
* 当缓存未命中但 DB 已确认/创建会话后,调用 `SetConversationStatus` 回写 Redis
* 缓存写回失败时记录日志,不中断聊天主流程,确保业务流畅性
fix: 🐛 修复历史消息顺序问题与编译错误
* 修复历史消息顺序问题,保证返回的 N 条历史消息按时间正序喂给模型
* 通过反转 `created_at desc` 查询结果的切片,确保模型输入顺序正确
* 修复 `fmt.Errorf` 参数不匹配问题,修正编译错误
* 整理 `agent-cache.go` 为标准 UTF-8 编码,避免 Go 编译报错 `invalid UTF-8 encoding`
feat: 🛠️ 独立构建 MCP 服务器
* 使用 `Codex` 构建独立于后端的 MCP 服务器,简化与 Codex 的协作
* 通过该服务器方便 Codex 直接测试和查看 Redis 与 MySQL 中的数据
|
2026-03-07 15:25:40 +08:00 |
|
LoveLosita
|
204e78d1fe
|
Version: 0.4.3.dev.260305
perf: ⚡ 引入 Redis 缓存优化上下文读写性能
* 为上下文写入与提取逻辑新增 Redis 缓存层,减少数据库直接读取开销
* 在 Redis 中实现简单滑动窗口裁剪策略,控制上下文消息数量并降低存储压力
refactor: ♻️ 上下文持久化逻辑改为异步执行
* 对写缓存与写数据库逻辑引入 `goroutine` 实现简单异步处理
* 降低接口阻塞时间,提高 Agent 对话接口响应性能
* 当前尚未完善异步流程中的错误传递与处理机制,后续将补充完整错误链路管理
|
2026-03-05 22:36:53 +08:00 |
|