Version: 0.9.77.dev.260505

后端： 1.阶段 6 CP4/CP5 目录收口与共享边界纯化 - 将 backend 根目录收口为 services、client、gateway、cmd、shared 五个一级目录 - 收拢 bootstrap、inits、infra/kafka、infra/outbox、conv、respond、pkg、middleware，移除根目录旧实现与空目录 - 将 utils 下沉到 services/userauth/internal/auth，将 logic 下沉到 services/schedule/core/planning - 将迁移期 runtime 桥接实现统一收拢到 services/runtime/{conv,dao,eventsvc,model}，删除 shared/legacy 与未再被 import 的旧 service 实现 - 将 gateway/shared/respond 收口为 HTTP/Gin 错误写回适配，shared/respond 仅保留共享错误语义与状态映射 - 将 HTTP IdempotencyMiddleware 与 RateLimitMiddleware 收口到 gateway/middleware - 将 GormCachePlugin 下沉到 shared/infra/gormcache，将共享 RateLimiter 下沉到 shared/infra/ratelimit，将 agent token budget 下沉到 services/agent/shared - 删除 InitEino 兼容壳，收缩 cmd/internal/coreinit 仅保留旧组合壳残留域初始化语义 - 更新微服务迁移计划与桌面 checklist，补齐 CP4/CP5 当前切流点、目录终态与验证结果 - 完成 go test ./...、git diff --check 与最终真实 smoke；health、register/login、task/create+get、schedule/today、task-class/list、memory/items、agent chat/meta/timeline/context-stats 全部 200，SSE 合并结果为 CP5_OK 且 [DONE] 只有 1 个
2026-05-05 23:25:07 +08:00
parent 2a96f4c6f9
commit 3b6fca44a6
226 changed files with 731 additions and 3497 deletions
--- a/backend/services/agent/conv/schedule_preview.go
+++ b/backend/services/agent/conv/schedule_preview.go
@@ -4,8 +4,8 @@ import (
 	"fmt"
 	"time"

-	"github.com/LoveLosita/smartflow/backend/model"
 	schedule "github.com/LoveLosita/smartflow/backend/services/agent/tools/schedule"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/model"
 )

 // ScheduleStateToPreview 将 agent 的 ScheduleState 转换为前端预览缓存格式。
--- a/backend/services/agent/conv/schedule_provider.go
+++ b/backend/services/agent/conv/schedule_provider.go
@@ -6,10 +6,10 @@ import (
 	"sort"
 	"time"

-	baseconv "github.com/LoveLosita/smartflow/backend/conv"
-	"github.com/LoveLosita/smartflow/backend/dao"
-	"github.com/LoveLosita/smartflow/backend/model"
 	schedule "github.com/LoveLosita/smartflow/backend/services/agent/tools/schedule"
+	baseconv "github.com/LoveLosita/smartflow/backend/services/runtime/conv"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/dao"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/model"
 )

 // ScheduleProvider 实现 model.ScheduleStateProvider 接口。
--- a/backend/services/agent/conv/schedule_state.go
+++ b/backend/services/agent/conv/schedule_state.go
@@ -3,8 +3,8 @@ package agentconv
 import (
 	"sort"

-	"github.com/LoveLosita/smartflow/backend/model"
 	schedule "github.com/LoveLosita/smartflow/backend/services/agent/tools/schedule"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/model"
 )

 // WindowDay 表示排课窗口中的一天（相对周 + 周几）。
--- a/backend/services/agent/conv/schedule_state_apply.go
+++ b/backend/services/agent/conv/schedule_state_apply.go
@@ -1,9 +1,9 @@
 package agentconv

 import (
-	"github.com/LoveLosita/smartflow/backend/model"
-	"github.com/LoveLosita/smartflow/backend/respond"
 	schedule "github.com/LoveLosita/smartflow/backend/services/agent/tools/schedule"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/model"
+	"github.com/LoveLosita/smartflow/backend/shared/respond"
 )

 // ApplyPlacedItems 将前端提交的绝对时间放置项应用到 ScheduleState。
--- a/backend/services/agent/node/quick_task.go
+++ b/backend/services/agent/node/quick_task.go
@@ -8,13 +8,13 @@ import (
 	"strings"
 	"time"

-	taskmodel "github.com/LoveLosita/smartflow/backend/model"
 	agentmodel "github.com/LoveLosita/smartflow/backend/services/agent/model"
 	agentprompt "github.com/LoveLosita/smartflow/backend/services/agent/prompt"
 	agentrouter "github.com/LoveLosita/smartflow/backend/services/agent/router"
 	agentshared "github.com/LoveLosita/smartflow/backend/services/agent/shared"
 	agentstream "github.com/LoveLosita/smartflow/backend/services/agent/stream"
 	llmservice "github.com/LoveLosita/smartflow/backend/services/llm"
+	taskmodel "github.com/LoveLosita/smartflow/backend/services/runtime/model"
 	"github.com/cloudwego/eino/schema"
 )

--- a/backend/services/agent/node/unified_compact.go
+++ b/backend/services/agent/node/unified_compact.go
@@ -6,9 +6,9 @@ import (
 	"fmt"
 	"log"

-	"github.com/LoveLosita/smartflow/backend/pkg"
 	agentmodel "github.com/LoveLosita/smartflow/backend/services/agent/model"
 	agentprompt "github.com/LoveLosita/smartflow/backend/services/agent/prompt"
+	agentshared "github.com/LoveLosita/smartflow/backend/services/agent/shared"
 	agentstream "github.com/LoveLosita/smartflow/backend/services/agent/stream"
 	llmservice "github.com/LoveLosita/smartflow/backend/services/llm"
 	"github.com/cloudwego/eino/schema"
@@ -78,7 +78,7 @@ func compactUnifiedMessagesIfNeeded(
 	msg3 := messages[3].Content

 	// 3. Token 预算检查。
-	breakdown, overBudget, needCompactMsg1, needCompactMsg2 := pkg.CheckStageTokenBudget(msg0, msg1, msg2, msg3)
+	breakdown, overBudget, needCompactMsg1, needCompactMsg2 := agentshared.CheckStageTokenBudget(msg0, msg1, msg2, msg3)

 	log.Printf(
 		"[COMPACT:%s] token budget check: total=%d budget=%d over=%v compactMsg1=%v compactMsg2=%v (msg0=%d msg1=%d msg2=%d msg3=%d)",
@@ -97,14 +97,14 @@ func compactUnifiedMessagesIfNeeded(
 		msg1 = compactUnifiedMsg1(ctx, input, msg1)
 		messages[1].Content = msg1
 		// 压缩 msg1 后重算预算。
-		breakdown = pkg.EstimateStageMessagesTokens(msg0, msg1, msg2, msg3)
+		breakdown = agentshared.EstimateStageMessagesTokens(msg0, msg1, msg2, msg3)
 	}

 	// 6. msg2 压缩（阶段工作区 → LLM 摘要）。
-	if needCompactMsg2 || breakdown.Total > pkg.StageTokenBudget {
+	if needCompactMsg2 || breakdown.Total > agentshared.StageTokenBudget {
 		msg2 = compactUnifiedMsg2(ctx, input, msg2)
 		messages[2].Content = msg2
-		breakdown = pkg.EstimateStageMessagesTokens(msg0, msg1, msg2, msg3)
+		breakdown = agentshared.EstimateStageMessagesTokens(msg0, msg1, msg2, msg3)
 	}

 	// 7. 记录最终 token 分布。
@@ -124,8 +124,8 @@ func compactUnifiedMessagesIfNeeded(
 // 1. 先按消息类型汇总 token，保证总量准确；
 // 2. 再把最后一个 user 消息尽量视作 msg3，保留阶段指令语义；
 // 3. 其他历史内容归入 msg1 / msg2，确保上下文统计不会因为结构不标准而断更。
-func estimateFallbackStageTokenBreakdown(messages []*schema.Message) pkg.StageTokenBreakdown {
-	breakdown := pkg.StageTokenBreakdown{Budget: pkg.StageTokenBudget}
+func estimateFallbackStageTokenBreakdown(messages []*schema.Message) agentshared.StageTokenBreakdown {
+	breakdown := agentshared.StageTokenBreakdown{Budget: agentshared.StageTokenBudget}
 	if len(messages) == 0 {
 		return breakdown
 	}
@@ -146,7 +146,7 @@ func estimateFallbackStageTokenBreakdown(messages []*schema.Message) pkg.StageTo
 		if msg == nil {
 			continue
 		}
-		tokens := pkg.EstimateMessageTokens(msg)
+		tokens := agentshared.EstimateMessageTokens(msg)
 		breakdown.Total += tokens

 		switch msg.Role {
@@ -199,7 +199,7 @@ func compactUnifiedMsg1(
 	}

 	// 3. SSE: 压缩开始。
-	tokenBefore := pkg.EstimateTextTokens(msg1)
+	tokenBefore := agentshared.EstimateTextTokens(msg1)
 	_ = input.Emitter.EmitStatus(
 		input.StatusBlockID, input.StageName, "context_compact_start",
 		fmt.Sprintf("正在压缩对话历史（%d tokens）...", tokenBefore),
@@ -219,7 +219,7 @@ func compactUnifiedMsg1(
 	}

 	// 5. SSE: 压缩完成。
-	tokenAfter := pkg.EstimateTextTokens(newSummary)
+	tokenAfter := agentshared.EstimateTextTokens(newSummary)
 	_ = input.Emitter.EmitStatus(
 		input.StatusBlockID, input.StageName, "context_compact_done",
 		fmt.Sprintf("对话历史已压缩：%d → %d tokens", tokenBefore, tokenAfter),
@@ -246,7 +246,7 @@ func compactUnifiedMsg2(
 	msg2 string,
 ) string {
 	// 1. SSE: 压缩开始。
-	tokenBefore := pkg.EstimateTextTokens(msg2)
+	tokenBefore := agentshared.EstimateTextTokens(msg2)
 	_ = input.Emitter.EmitStatus(
 		input.StatusBlockID, input.StageName, "context_compact_start",
 		fmt.Sprintf("正在压缩执行记录（%d tokens）...", tokenBefore),
@@ -266,7 +266,7 @@ func compactUnifiedMsg2(
 	}

 	// 3. SSE: 压缩完成。
-	tokenAfter := pkg.EstimateTextTokens(compressed)
+	tokenAfter := agentshared.EstimateTextTokens(compressed)
 	_ = input.Emitter.EmitStatus(
 		input.StatusBlockID, input.StageName, "context_compact_done",
 		fmt.Sprintf("执行记录已压缩：%d → %d tokens", tokenBefore, tokenAfter),
@@ -285,7 +285,7 @@ func compactUnifiedMsg2(
 func saveUnifiedTokenStats(
 	ctx context.Context,
 	input UnifiedCompactInput,
-	breakdown pkg.StageTokenBreakdown,
+	breakdown agentshared.StageTokenBreakdown,
 ) {
 	if input.CompactionStore == nil || input.FlowState == nil {
 		return
--- a/backend/services/agent/rpc/errors.go
+++ b/backend/services/agent/rpc/errors.go
@@ -5,7 +5,7 @@ import (
 	"log"
 	"strings"

-	"github.com/LoveLosita/smartflow/backend/respond"
+	"github.com/LoveLosita/smartflow/backend/shared/respond"
 	"google.golang.org/genproto/googleapis/rpc/errdetails"
 	"google.golang.org/grpc/codes"
 	"google.golang.org/grpc/status"
--- a/backend/services/agent/rpc/handler.go
+++ b/backend/services/agent/rpc/handler.go
@@ -6,11 +6,11 @@ import (
 	"errors"
 	"strings"

-	"github.com/LoveLosita/smartflow/backend/model"
-	"github.com/LoveLosita/smartflow/backend/respond"
 	"github.com/LoveLosita/smartflow/backend/services/agent/rpc/pb"
 	agentsv "github.com/LoveLosita/smartflow/backend/services/agent/sv"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/model"
 	agentcontracts "github.com/LoveLosita/smartflow/backend/shared/contracts/agent"
+	"github.com/LoveLosita/smartflow/backend/shared/respond"
 )

 type Handler struct {
--- a/backend/services/agent/shared/clone.go
+++ b/backend/services/agent/shared/clone.go
@@ -1,6 +1,6 @@
 package agentshared

-import "github.com/LoveLosita/smartflow/backend/model"
+import "github.com/LoveLosita/smartflow/backend/services/runtime/model"

 func CloneWeekSchedules(src []model.UserWeekSchedule) []model.UserWeekSchedule {
 	if len(src) == 0 {
--- a/backend/services/agent/shared/node_unified_compact.go
+++ b/backend/services/agent/shared/node_unified_compact.go
@@ -6,7 +6,6 @@ import (
 	"fmt"
 	"log"

-	"github.com/LoveLosita/smartflow/backend/pkg"
 	agentmodel "github.com/LoveLosita/smartflow/backend/services/agent/model"
 	agentprompt "github.com/LoveLosita/smartflow/backend/services/agent/prompt"
 	agentstream "github.com/LoveLosita/smartflow/backend/services/agent/stream"
@@ -77,7 +76,7 @@ func CompactUnifiedMessagesIfNeeded(
 	msg3 := messages[3].Content

 	// 3. 执行 token 预算检查，判断是否需要压缩历史对话或阶段工作区。
-	breakdown, overBudget, needCompactMsg1, needCompactMsg2 := pkg.CheckStageTokenBudget(msg0, msg1, msg2, msg3)
+	breakdown, overBudget, needCompactMsg1, needCompactMsg2 := CheckStageTokenBudget(msg0, msg1, msg2, msg3)

 	log.Printf(
 		"[COMPACT:%s] token budget check: total=%d budget=%d over=%v compactMsg1=%v compactMsg2=%v (msg0=%d msg1=%d msg2=%d msg3=%d)",
@@ -95,14 +94,14 @@ func CompactUnifiedMessagesIfNeeded(
 	if needCompactMsg1 {
 		msg1 = compactUnifiedMsg1(ctx, input, msg1)
 		messages[1].Content = msg1
-		breakdown = pkg.EstimateStageMessagesTokens(msg0, msg1, msg2, msg3)
+		breakdown = EstimateStageMessagesTokens(msg0, msg1, msg2, msg3)
 	}

 	// 6. 若 msg1 压缩后仍超限，再压缩 msg2（阶段工作区 / ReAct 记录）。
-	if needCompactMsg2 || breakdown.Total > pkg.StageTokenBudget {
+	if needCompactMsg2 || breakdown.Total > StageTokenBudget {
 		msg2 = compactUnifiedMsg2(ctx, input, msg2)
 		messages[2].Content = msg2
-		breakdown = pkg.EstimateStageMessagesTokens(msg0, msg1, msg2, msg3)
+		breakdown = EstimateStageMessagesTokens(msg0, msg1, msg2, msg3)
 	}

 	// 7. 记录最终 token 分布，供后续调试与监控使用。
@@ -122,8 +121,8 @@ func CompactUnifiedMessagesIfNeeded(
 // 1. 先按消息类型汇总 token，保证总量准确；
 // 2. 再把最后一个 user 消息尽量视作 msg3，保留阶段指令语义；
 // 3. 其他历史内容归入 msg1 / msg2，确保上下文统计不会因为结构不标准而断更。
-func estimateFallbackStageTokenBreakdown(messages []*schema.Message) pkg.StageTokenBreakdown {
-	breakdown := pkg.StageTokenBreakdown{Budget: pkg.StageTokenBudget}
+func estimateFallbackStageTokenBreakdown(messages []*schema.Message) StageTokenBreakdown {
+	breakdown := StageTokenBreakdown{Budget: StageTokenBudget}
 	if len(messages) == 0 {
 		return breakdown
 	}
@@ -144,7 +143,7 @@ func estimateFallbackStageTokenBreakdown(messages []*schema.Message) pkg.StageTo
 		if msg == nil {
 			continue
 		}
-		tokens := pkg.EstimateMessageTokens(msg)
+		tokens := EstimateMessageTokens(msg)
 		breakdown.Total += tokens

 		switch msg.Role {
@@ -194,7 +193,7 @@ func compactUnifiedMsg1(
 		log.Printf("[COMPACT:%s] load existing compaction failed: %v, proceed without cache", input.StageName, err)
 	}

-	tokenBefore := pkg.EstimateTextTokens(msg1)
+	tokenBefore := EstimateTextTokens(msg1)
 	_ = input.Emitter.EmitStatus(
 		input.StatusBlockID, input.StageName, "context_compact_start",
 		fmt.Sprintf("正在压缩对话历史（%d tokens）...", tokenBefore),
@@ -212,7 +211,7 @@ func compactUnifiedMsg1(
 		return msg1
 	}

-	tokenAfter := pkg.EstimateTextTokens(newSummary)
+	tokenAfter := EstimateTextTokens(newSummary)
 	_ = input.Emitter.EmitStatus(
 		input.StatusBlockID, input.StageName, "context_compact_done",
 		fmt.Sprintf("对话历史已压缩：%d → %d tokens", tokenBefore, tokenAfter),
@@ -237,7 +236,7 @@ func compactUnifiedMsg2(
 	input UnifiedCompactInput,
 	msg2 string,
 ) string {
-	tokenBefore := pkg.EstimateTextTokens(msg2)
+	tokenBefore := EstimateTextTokens(msg2)
 	_ = input.Emitter.EmitStatus(
 		input.StatusBlockID, input.StageName, "context_compact_start",
 		fmt.Sprintf("正在压缩执行记录（%d tokens）...", tokenBefore),
@@ -255,7 +254,7 @@ func compactUnifiedMsg2(
 		return msg2
 	}

-	tokenAfter := pkg.EstimateTextTokens(compressed)
+	tokenAfter := EstimateTextTokens(compressed)
 	_ = input.Emitter.EmitStatus(
 		input.StatusBlockID, input.StageName, "context_compact_done",
 		fmt.Sprintf("执行记录已压缩：%d → %d tokens", tokenBefore, tokenAfter),
@@ -274,7 +273,7 @@ func compactUnifiedMsg2(
 func saveUnifiedTokenStats(
 	ctx context.Context,
 	input UnifiedCompactInput,
-	breakdown pkg.StageTokenBreakdown,
+	breakdown StageTokenBreakdown,
 ) {
 	if input.CompactionStore == nil || input.FlowState == nil {
 		return
--- a/backend/services/agent/shared/token_budget.go
+++ b/backend/services/agent/shared/token_budget.go
@@ -0,0 +1,209 @@
+package agentshared
+
+import (
+	"math"
+	"strings"
+	"unicode"
+
+	"github.com/cloudwego/eino/schema"
+)
+
+const (
+	// Worker 模型最大输入上下文（用户提供）
+	WorkerMaxInputTokens = 224000
+	// 给模型输出和协议开销预留的冗余 token
+	ContextReserveTokens = 28000
+
+	// 缓存未命中时，从数据库拉取的历史消息上限
+	DefaultHistoryFetchLimit = 1200
+
+	// Redis 会话窗口上下限与缓冲
+	SessionWindowMin    = 32
+	SessionWindowMax    = 4096
+	SessionWindowBuffer = 2
+
+	// ---- Execute Context Compaction 预算 ----
+	// Execute 阶段 prompt 总 token 上限
+	ExecuteTokenBudget = 80000
+	// msg0 + msg3 固定开销 + 安全余量
+	ExecuteReserveTokens = 8000
+	StageTokenBudget     = ExecuteTokenBudget
+	StageReserveTokens   = ExecuteReserveTokens
+)
+
+// MaxContextTokensByModel 返回指定模型的最大上下文 token。
+func MaxContextTokensByModel(modelName string) int {
+	switch strings.ToLower(strings.TrimSpace(modelName)) {
+	case "worker", "strategist":
+		return WorkerMaxInputTokens
+	default:
+		return WorkerMaxInputTokens
+	}
+}
+
+// HistoryFetchLimitByModel 返回缓存未命中时的历史拉取条数。
+func HistoryFetchLimitByModel(_ string) int {
+	return DefaultHistoryFetchLimit
+}
+
+// HistoryTokenBudgetByModel 计算“历史上下文”可使用的 token 预算。
+func HistoryTokenBudgetByModel(modelName, systemPrompt, userInput string) int {
+	maxTokens := MaxContextTokensByModel(modelName)
+	baseTokens := EstimateTextTokens(systemPrompt) + EstimateTextTokens(userInput) + 64
+	budget := maxTokens - ContextReserveTokens - baseTokens
+	if budget < 0 {
+		return 0
+	}
+	return budget
+}
+
+// EstimateTextTokens 粗略估算文本 token：
+// - CJK 字符约 1:1
+// - ASCII 字符约 4:1
+// - 其他字符约 2:1
+func EstimateTextTokens(text string) int {
+	if strings.TrimSpace(text) == "" {
+		return 0
+	}
+
+	var cjkCount, asciiCount, otherCount int
+	for _, r := range text {
+		switch {
+		case unicode.IsSpace(r):
+			continue
+		case r <= unicode.MaxASCII:
+			asciiCount++
+		case isCJK(r):
+			cjkCount++
+		default:
+			otherCount++
+		}
+	}
+
+	tokens := cjkCount + int(math.Ceil(float64(asciiCount)/4.0)) + int(math.Ceil(float64(otherCount)/2.0))
+	if tokens <= 0 {
+		return 1
+	}
+	return tokens
+}
+
+// EstimateMessageTokens 估算单条消息 token（包含固定协议开销）。
+func EstimateMessageTokens(msg *schema.Message) int {
+	if msg == nil {
+		return 0
+	}
+	const messageOverhead = 6
+	return messageOverhead + EstimateTextTokens(msg.Content) + EstimateTextTokens(msg.ReasoningContent)
+}
+
+// EstimateHistoryTokens 估算历史消息总 token。
+func EstimateHistoryTokens(history []*schema.Message) int {
+	total := 0
+	for _, msg := range history {
+		total += EstimateMessageTokens(msg)
+	}
+	return total
+}
+
+// TrimHistoryByTokenBudget 从最旧消息开始裁剪，直到历史 token 不超过预算。
+// 返回值：裁剪后历史、裁剪前 token、裁剪后 token、裁掉条数。
+func TrimHistoryByTokenBudget(history []*schema.Message, historyBudget int) ([]*schema.Message, int, int, int) {
+	if len(history) == 0 {
+		return history, 0, 0, 0
+	}
+
+	totalBefore := EstimateHistoryTokens(history)
+	if historyBudget <= 0 {
+		return []*schema.Message{}, totalBefore, 0, len(history)
+	}
+	if totalBefore <= historyBudget {
+		return history, totalBefore, totalBefore, 0
+	}
+
+	tokenPerMsg := make([]int, len(history))
+	total := 0
+	for i, msg := range history {
+		t := EstimateMessageTokens(msg)
+		tokenPerMsg[i] = t
+		total += t
+	}
+
+	drop := 0
+	for total > historyBudget && drop < len(history) {
+		total -= tokenPerMsg[drop]
+		drop++
+	}
+
+	return history[drop:], totalBefore, total, drop
+}
+
+// CalcSessionWindowSize 根据裁剪后消息条数计算 Redis 队列窗口大小。
+func CalcSessionWindowSize(trimmedHistoryLen int) int {
+	size := trimmedHistoryLen + SessionWindowBuffer
+	if size < SessionWindowMin {
+		size = SessionWindowMin
+	}
+	if size > SessionWindowMax {
+		size = SessionWindowMax
+	}
+	return size
+}
+
+func isCJK(r rune) bool {
+	return unicode.Is(unicode.Han, r) || unicode.Is(unicode.Hiragana, r) || unicode.Is(unicode.Katakana, r) || unicode.Is(unicode.Hangul, r)
+}
+
+// StageTokenBreakdown 记录四条阶段消息的 token 分布。
+type StageTokenBreakdown struct {
+	Msg0   int `json:"msg0"`
+	Msg1   int `json:"msg1"`
+	Msg2   int `json:"msg2"`
+	Msg3   int `json:"msg3"`
+	Total  int `json:"total"`
+	Budget int `json:"budget"`
+}
+
+// ExecuteTokenBreakdown 保留为历史兼容别名，避免旧调用点改动。
+type ExecuteTokenBreakdown = StageTokenBreakdown
+
+// EstimateStageMessagesTokens 估算四条阶段消息的 token 分布。
+func EstimateStageMessagesTokens(msg0, msg1, msg2, msg3 string) StageTokenBreakdown {
+	b := StageTokenBreakdown{
+		Msg0:   EstimateTextTokens(msg0),
+		Msg1:   EstimateTextTokens(msg1),
+		Msg2:   EstimateTextTokens(msg2),
+		Msg3:   EstimateTextTokens(msg3),
+		Budget: StageTokenBudget,
+	}
+	b.Total = b.Msg0 + b.Msg1 + b.Msg2 + b.Msg3
+	return b
+}
+
+// CheckStageTokenBudget 检查是否超出阶段预算，并给出需要压缩的消息标记。
+//
+// 1. 先计算四条消息的 token 分布，便于后续日志和统计。
+// 2. 如果总量没有超预算，直接返回。
+// 3. 如果超预算，则按 msg1 / msg2 的相对占比判断是否需要分别压缩。
+func CheckStageTokenBudget(msg0, msg1, msg2, msg3 string) (breakdown StageTokenBreakdown, overBudget bool, needCompactMsg1 bool, needCompactMsg2 bool) {
+	breakdown = EstimateStageMessagesTokens(msg0, msg1, msg2, msg3)
+	overBudget = breakdown.Total > StageTokenBudget
+	if !overBudget {
+		return
+	}
+	// msg1 过大时，优先压缩历史对话。
+	available := StageTokenBudget - StageReserveTokens
+	needCompactMsg1 = breakdown.Msg1 > available/2
+	// 若压缩 msg1 后仍然超限，再压缩执行记录区。
+	needCompactMsg2 = (breakdown.Total - breakdown.Msg1 + available/4) > StageTokenBudget
+	return
+}
+
+// EstimateExecuteMessagesTokens 保留旧名称，内部复用阶段预算实现。
+func EstimateExecuteMessagesTokens(msg0, msg1, msg2, msg3 string) StageTokenBreakdown {
+	return EstimateStageMessagesTokens(msg0, msg1, msg2, msg3)
+}
+
+// CheckExecuteTokenBudget 保留旧名称，内部复用阶段预算实现。
+func CheckExecuteTokenBudget(msg0, msg1, msg2, msg3 string) (breakdown StageTokenBreakdown, overBudget bool, needCompactMsg1 bool, needCompactMsg2 bool) {
+	return CheckStageTokenBudget(msg0, msg1, msg2, msg3)
+}
--- a/backend/services/agent/sv/agent.go
+++ b/backend/services/agent/sv/agent.go
@@ -9,18 +9,18 @@ import (
 	"strings"
 	"time"

-	"github.com/LoveLosita/smartflow/backend/conv"
-	"github.com/LoveLosita/smartflow/backend/dao"
-	outboxinfra "github.com/LoveLosita/smartflow/backend/infra/outbox"
-	"github.com/LoveLosita/smartflow/backend/model"
-	"github.com/LoveLosita/smartflow/backend/pkg"
-	eventsvc "github.com/LoveLosita/smartflow/backend/service/events"
 	agentmodel "github.com/LoveLosita/smartflow/backend/services/agent/model"
 	agentprompt "github.com/LoveLosita/smartflow/backend/services/agent/prompt"
+	agentshared "github.com/LoveLosita/smartflow/backend/services/agent/shared"
 	agenttools "github.com/LoveLosita/smartflow/backend/services/agent/tools"
 	llmservice "github.com/LoveLosita/smartflow/backend/services/llm"
 	memorymodel "github.com/LoveLosita/smartflow/backend/services/memory/model"
 	memoryobserve "github.com/LoveLosita/smartflow/backend/services/memory/observe"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/conv"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/dao"
+	eventsvc "github.com/LoveLosita/smartflow/backend/services/runtime/eventsvc"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/model"
+	outboxinfra "github.com/LoveLosita/smartflow/backend/shared/infra/outbox"
 	"github.com/cloudwego/eino/schema"
 	"github.com/google/uuid"
 )
@@ -333,7 +333,7 @@ func (s *AgentService) runNormalChatFlow(
 	if chatHistory == nil {
 		// 2. 缓存未命中时回源 DB，并转换为 Eino message 格式。
 		cacheMiss = true
-		histories, hisErr := s.repo.GetUserChatHistories(ctx, userID, pkg.HistoryFetchLimitByModel(resolvedModelName), chatID)
+		histories, hisErr := s.repo.GetUserChatHistories(ctx, userID, agentshared.HistoryFetchLimitByModel(resolvedModelName), chatID)
 		if hisErr != nil {
 			pushErrNonBlocking(errChan, hisErr)
 			return
@@ -343,12 +343,12 @@ func (s *AgentService) runNormalChatFlow(

 	// 3. 计算本次请求可用的历史 token 预算，并执行历史裁剪。
 	//    这样可以在上下文增长时稳定控制模型窗口，避免超长上下文引发报错或高延迟。
-	historyBudget := pkg.HistoryTokenBudgetByModel(resolvedModelName, agentprompt.SystemPrompt, userMessage)
-	trimmedHistory, totalHistoryTokens, keptHistoryTokens, droppedCount := pkg.TrimHistoryByTokenBudget(chatHistory, historyBudget)
+	historyBudget := agentshared.HistoryTokenBudgetByModel(resolvedModelName, agentprompt.SystemPrompt, userMessage)
+	trimmedHistory, totalHistoryTokens, keptHistoryTokens, droppedCount := agentshared.TrimHistoryByTokenBudget(chatHistory, historyBudget)
 	chatHistory = trimmedHistory

 	// 4. 根据裁剪后历史长度更新 Redis 会话窗口配置，并主动执行窗口收敛。
-	targetWindow := pkg.CalcSessionWindowSize(len(chatHistory))
+	targetWindow := agentshared.CalcSessionWindowSize(len(chatHistory))
 	if err = s.agentCache.SetSessionWindowSize(ctx, chatID, targetWindow); err != nil {
 		log.Printf("设置历史窗口失败 chat=%s: %v", chatID, err)
 	}
--- a/backend/services/agent/sv/agent_active_schedule_session.go
+++ b/backend/services/agent/sv/agent_active_schedule_session.go
@@ -7,8 +7,8 @@ import (
 	"strings"
 	"time"

-	"github.com/LoveLosita/smartflow/backend/model"
 	agentstream "github.com/LoveLosita/smartflow/backend/services/agent/stream"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/model"
 	"github.com/cloudwego/eino/schema"
 )

--- a/backend/services/agent/sv/agent_graph.go
+++ b/backend/services/agent/sv/agent_graph.go
@@ -17,12 +17,12 @@ import (
 	"github.com/cloudwego/eino/schema"
 	"github.com/spf13/viper"

-	"github.com/LoveLosita/smartflow/backend/conv"
-	"github.com/LoveLosita/smartflow/backend/model"
-	"github.com/LoveLosita/smartflow/backend/pkg"
-	"github.com/LoveLosita/smartflow/backend/respond"
-	eventsvc "github.com/LoveLosita/smartflow/backend/service/events"
 	agentprompt "github.com/LoveLosita/smartflow/backend/services/agent/prompt"
+	agentshared "github.com/LoveLosita/smartflow/backend/services/agent/shared"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/conv"
+	eventsvc "github.com/LoveLosita/smartflow/backend/services/runtime/eventsvc"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/model"
+	"github.com/LoveLosita/smartflow/backend/shared/respond"
 )

 const (
@@ -410,7 +410,7 @@ func (s *AgentService) loadConversationContext(ctx context.Context, chatID, user

 	// 缓存未命中时回源 DB。
 	if history == nil {
-		histories, hisErr := s.repo.GetUserChatHistories(ctx, 0, pkg.HistoryFetchLimitByModel("worker"), chatID)
+		histories, hisErr := s.repo.GetUserChatHistories(ctx, 0, agentshared.HistoryFetchLimitByModel("worker"), chatID)
 		if hisErr != nil {
 			log.Printf("从 DB 加载历史失败 chat=%s: %v", chatID, hisErr)
 		} else {
--- a/backend/services/agent/sv/agent_meta.go
+++ b/backend/services/agent/sv/agent_meta.go
@@ -8,10 +8,10 @@ import (
 	"time"
 	"unicode/utf8"

-	"github.com/LoveLosita/smartflow/backend/model"
-	"github.com/LoveLosita/smartflow/backend/respond"
-	eventsvc "github.com/LoveLosita/smartflow/backend/service/events"
 	llmservice "github.com/LoveLosita/smartflow/backend/services/llm"
+	eventsvc "github.com/LoveLosita/smartflow/backend/services/runtime/eventsvc"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/model"
+	"github.com/LoveLosita/smartflow/backend/shared/respond"
 	"github.com/cloudwego/eino/schema"
 )

--- a/backend/services/agent/sv/agent_schedule_preview.go
+++ b/backend/services/agent/sv/agent_schedule_preview.go
@@ -7,9 +7,9 @@ import (
 	"strings"
 	"time"

-	"github.com/LoveLosita/smartflow/backend/model"
-	"github.com/LoveLosita/smartflow/backend/respond"
 	agentshared "github.com/LoveLosita/smartflow/backend/services/agent/shared"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/model"
+	"github.com/LoveLosita/smartflow/backend/shared/respond"
 )

 // GetSchedulePlanPreview 按 conversation_id 读取结构化排程预览。
--- a/backend/services/agent/sv/agent_schedule_state.go
+++ b/backend/services/agent/sv/agent_schedule_state.go
@@ -7,11 +7,11 @@ import (
 	"log"
 	"strings"

-	"github.com/LoveLosita/smartflow/backend/model"
-	"github.com/LoveLosita/smartflow/backend/respond"
 	agentconv "github.com/LoveLosita/smartflow/backend/services/agent/conv"
 	agentmodel "github.com/LoveLosita/smartflow/backend/services/agent/model"
 	agentshared "github.com/LoveLosita/smartflow/backend/services/agent/shared"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/model"
+	"github.com/LoveLosita/smartflow/backend/shared/respond"
 )

 // SaveScheduleState 处理前端拖拽后的“暂存排程状态”请求。
--- a/backend/services/agent/sv/agent_task_query.go
+++ b/backend/services/agent/sv/agent_task_query.go
@@ -7,9 +7,9 @@ import (
 	"strings"
 	"time"

-	"github.com/LoveLosita/smartflow/backend/model"
-	"github.com/LoveLosita/smartflow/backend/respond"
 	agentmodel "github.com/LoveLosita/smartflow/backend/services/agent/model"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/model"
+	"github.com/LoveLosita/smartflow/backend/shared/respond"
 )

 func (s *AgentService) QueryTasksForTool(ctx context.Context, req agentmodel.TaskQueryRequest) ([]agentmodel.TaskQueryTaskRecord, error) {
--- a/backend/services/agent/sv/agent_timeline.go
+++ b/backend/services/agent/sv/agent_timeline.go
@@ -8,9 +8,9 @@ import (
 	"strings"
 	"time"

-	"github.com/LoveLosita/smartflow/backend/model"
-	eventsvc "github.com/LoveLosita/smartflow/backend/service/events"
 	agentstream "github.com/LoveLosita/smartflow/backend/services/agent/stream"
+	eventsvc "github.com/LoveLosita/smartflow/backend/services/runtime/eventsvc"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/model"
 	"gorm.io/gorm"
 )

--- a/backend/services/agent/sv/memory_rpc_reader.go
+++ b/backend/services/agent/sv/memory_rpc_reader.go
@@ -13,7 +13,7 @@ import (
 //
 // 职责边界：
 // 1. 只读取候选记忆，不暴露管理写接口；
-// 2. 不要求调用方知道 gateway/client/memory 的具体实现；
+// 2. 不要求调用方知道 backend/client/memory 的具体实现；
 // 3. 错误原样返回给预取链路，由 agent 侧负责软降级和观测记录。
 type MemoryRPCReaderClient interface {
 	Retrieve(ctx context.Context, req memorycontracts.RetrieveRequest) ([]memorycontracts.ItemDTO, error)
--- a/backend/services/agent/sv/schedule_rpc_provider.go
+++ b/backend/services/agent/sv/schedule_rpc_provider.go
@@ -8,9 +8,9 @@ import (
 	"strings"
 	"time"

-	"github.com/LoveLosita/smartflow/backend/model"
 	agentconv "github.com/LoveLosita/smartflow/backend/services/agent/conv"
 	scheduletool "github.com/LoveLosita/smartflow/backend/services/agent/tools/schedule"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/model"
 	schedulecontracts "github.com/LoveLosita/smartflow/backend/shared/contracts/schedule"
 	taskclasscontracts "github.com/LoveLosita/smartflow/backend/shared/contracts/taskclass"
 )
--- a/backend/services/agent/sv/task_class_rpc_adapter.go
+++ b/backend/services/agent/sv/task_class_rpc_adapter.go
@@ -7,8 +7,8 @@ import (
 	"strings"
 	"time"

-	"github.com/LoveLosita/smartflow/backend/model"
 	agenttools "github.com/LoveLosita/smartflow/backend/services/agent/tools"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/model"
 	taskclasscontracts "github.com/LoveLosita/smartflow/backend/shared/contracts/taskclass"
 )

--- a/backend/services/agent/sv/task_rpc_adapter.go
+++ b/backend/services/agent/sv/task_rpc_adapter.go
@@ -7,10 +7,10 @@ import (
 	"strings"
 	"time"

-	"github.com/LoveLosita/smartflow/backend/model"
-	"github.com/LoveLosita/smartflow/backend/respond"
 	agentmodel "github.com/LoveLosita/smartflow/backend/services/agent/model"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/model"
 	taskcontracts "github.com/LoveLosita/smartflow/backend/shared/contracts/task"
+	"github.com/LoveLosita/smartflow/backend/shared/respond"
 )

 const quickTaskCreateRPCTimeout = 3 * time.Second
--- a/backend/services/agent/tools/task_class_write.go
+++ b/backend/services/agent/tools/task_class_write.go
@@ -6,7 +6,7 @@ import (
 	"strings"
 	"time"

-	"github.com/LoveLosita/smartflow/backend/model"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/model"
 )

 // TaskClassUpsertInput 描述任务类写库工具的标准化入参。
--- a/backend/services/agent/tools/taskclass_result_handlers.go
+++ b/backend/services/agent/tools/taskclass_result_handlers.go
@@ -3,9 +3,9 @@ package agenttools
 import (
 	"strings"

-	"github.com/LoveLosita/smartflow/backend/model"
 	"github.com/LoveLosita/smartflow/backend/services/agent/tools/schedule"
 	taskclassresult "github.com/LoveLosita/smartflow/backend/services/agent/tools/taskclass_result"
+	"github.com/LoveLosita/smartflow/backend/services/runtime/model"
 )

 type taskClassUpsertExecutionInput struct {