smartmate

Losita/smartmate

Fork 0

Commit Graph

Author	SHA1	Message	Date
LoveLosita	4906f814fd	Version: 0.4.6.dev.260307 feat: 🎯 新增 Token 估算与裁剪工具 * 在 `backend/pkg/token_budget.go` 中新增 Token 估算与裁剪工具 * 最大上下文 Token 数量设置为 224000，预留冗余 28000 * 从最旧消息开始裁剪，直到历史 Token 数量低于预算 * 根据裁剪后的历史消息数量动态计算 Redis 动态窗口大小 refactor: ♻️ 接入 Token 裁剪至 Service 主流程 * 在 `backend/service/agent.go` 中接入 Token 裁剪逻辑 * 先从历史数据获取（缓存未命中则查询数据库） * 按 Token 预算裁剪历史消息，裁剪后再喂模型 * 根据裁剪结果动态调整 Redis 会话窗口 refactor: ♻️ 改造 Redis 历史队列为会话级动态窗口 * 在 `backend/dao/agent-cache.go` 中新增 `SetSessionWindowSize` 与 `EnforceHistoryWindow` * `PushMessage` 和 `BackfillHistory` 方法使用会话动态窗口，而非固定 20 条历史消息 * 默认窗口大小提升至 128，但会被会话动态窗口值覆盖	2026-03-07 16:37:07 +08:00
LoveLosita	26c350f378	Version: 0.4.4.dev.260307 feat: 🚀 增强会话管理与缓存机制 * 会话 ID 空值兜底，若 `conversation_id` 为空时自动生成 UUID * 在响应头写入 `X-Conversation-ID`，供前端使用，保持同一会话状态 perf: ⚡ 会话状态缓存优化 * 当缓存未命中但 DB 已确认/创建会话后，调用 `SetConversationStatus` 回写 Redis * 缓存写回失败时记录日志，不中断聊天主流程，确保业务流畅性 fix: 🐛 修复历史消息顺序问题与编译错误 * 修复历史消息顺序问题，保证返回的 N 条历史消息按时间正序喂给模型 * 通过反转 `created_at desc` 查询结果的切片，确保模型输入顺序正确 * 修复 `fmt.Errorf` 参数不匹配问题，修正编译错误 * 整理 `agent-cache.go` 为标准 UTF-8 编码，避免 Go 编译报错 `invalid UTF-8 encoding` feat: 🛠️ 独立构建 MCP 服务器 * 使用 `Codex` 构建独立于后端的 MCP 服务器，简化与 Codex 的协作 * 通过该服务器方便 Codex 直接测试和查看 Redis 与 MySQL 中的数据	2026-03-07 15:25:40 +08:00
LoveLosita	204e78d1fe	Version: 0.4.3.dev.260305 perf: ⚡ 引入 Redis 缓存优化上下文读写性能 * 为上下文写入与提取逻辑新增 Redis 缓存层，减少数据库直接读取开销 * 在 Redis 中实现简单滑动窗口裁剪策略，控制上下文消息数量并降低存储压力 refactor: ♻️ 上下文持久化逻辑改为异步执行 * 对写缓存与写数据库逻辑引入 `goroutine` 实现简单异步处理 * 降低接口阻塞时间，提高 Agent 对话接口响应性能 * 当前尚未完善异步流程中的错误传递与处理机制，后续将补充完整错误链路管理	2026-03-05 22:36:53 +08:00

Author

SHA1

Message

Date

LoveLosita

4906f814fd

Version: 0.4.6.dev.260307

feat: 🎯 新增 Token 估算与裁剪工具

* 在 `backend/pkg/token_budget.go` 中新增 Token 估算与裁剪工具

  * 最大上下文 Token 数量设置为 224000，预留冗余 28000
  * 从最旧消息开始裁剪，直到历史 Token 数量低于预算
  * 根据裁剪后的历史消息数量动态计算 Redis 动态窗口大小

refactor: ♻️ 接入 Token 裁剪至 Service 主流程

* 在 `backend/service/agent.go` 中接入 Token 裁剪逻辑

  * 先从历史数据获取（缓存未命中则查询数据库）
  * 按 Token 预算裁剪历史消息，裁剪后再喂模型
  * 根据裁剪结果动态调整 Redis 会话窗口

refactor: ♻️ 改造 Redis 历史队列为会话级动态窗口

* 在 `backend/dao/agent-cache.go` 中新增 `SetSessionWindowSize` 与 `EnforceHistoryWindow`
* `PushMessage` 和 `BackfillHistory` 方法使用会话动态窗口，而非固定 20 条历史消息
* 默认窗口大小提升至 128，但会被会话动态窗口值覆盖

2026-03-07 16:37:07 +08:00

LoveLosita

26c350f378

Version: 0.4.4.dev.260307

feat: 🚀 增强会话管理与缓存机制

* 会话 ID 空值兜底，若 `conversation_id` 为空时自动生成 UUID
* 在响应头写入 `X-Conversation-ID`，供前端使用，保持同一会话状态

perf: ⚡ 会话状态缓存优化

* 当缓存未命中但 DB 已确认/创建会话后，调用 `SetConversationStatus` 回写 Redis
* 缓存写回失败时记录日志，不中断聊天主流程，确保业务流畅性

fix: 🐛 修复历史消息顺序问题与编译错误

* 修复历史消息顺序问题，保证返回的 N 条历史消息按时间正序喂给模型

  * 通过反转 `created_at desc` 查询结果的切片，确保模型输入顺序正确
* 修复 `fmt.Errorf` 参数不匹配问题，修正编译错误
* 整理 `agent-cache.go` 为标准 UTF-8 编码，避免 Go 编译报错 `invalid UTF-8 encoding`

feat: 🛠️ 独立构建 MCP 服务器

* 使用 `Codex` 构建独立于后端的 MCP 服务器，简化与 Codex 的协作
* 通过该服务器方便 Codex 直接测试和查看 Redis 与 MySQL 中的数据

2026-03-07 15:25:40 +08:00

LoveLosita

204e78d1fe

Version: 0.4.3.dev.260305

perf: ⚡ 引入 Redis 缓存优化上下文读写性能

* 为上下文写入与提取逻辑新增 Redis 缓存层，减少数据库直接读取开销
* 在 Redis 中实现简单滑动窗口裁剪策略，控制上下文消息数量并降低存储压力

refactor: ♻️ 上下文持久化逻辑改为异步执行

* 对写缓存与写数据库逻辑引入 `goroutine` 实现简单异步处理
* 降低接口阻塞时间，提高 Agent 对话接口响应性能
* 当前尚未完善异步流程中的错误传递与处理机制，后续将补充完整错误链路管理

2026-03-05 22:36:53 +08:00

3 Commits