Version: 0.8.5.dev.260330

后端： 1.把node/plan的具体逻辑做完了,没仔细看，进入下一步之前需要仔细review 前端：无改动全仓库：无改动
2026-03-30 22:08:30 +08:00
parent 6d22acb270
commit e1a06be768
10 changed files with 1494 additions and 184 deletions
--- a/backend/newAgent/stream/emitter.go
+++ b/backend/newAgent/stream/emitter.go
@@ -1,8 +1,10 @@
 package newagentstream

 import (
+	"context"
 	"fmt"
 	"strings"
+	"time"
 )

 // PayloadEmitter 是真正向外层 SSE 管道写 chunk 的最小接口。
@@ -13,9 +15,52 @@ import (
 // 3. 只要签名是 `func(string) error`，都能接进来。
 type PayloadEmitter func(payload string) error

-// StageEmitter 是 graph/node 对“当前阶段”进行推送的最小接口。
+// StageEmitter 是 graph/node 对“当前阶段”进行推送的兼容接口。
+//
+// 设计说明：
+// 1. 旧调用侧仍然只关心 stage/detail 两段文本，因此这里先保留；
+// 2. 新的结构化事件能力会通过 ChunkEmitter 补齐，而不是继续扩展这个函数签名；
+// 3. 这样能兼顾当前兼容性和后续协议升级空间。
 type StageEmitter func(stage, detail string)

+// PseudoStreamOptions 描述“整段文字伪流式输出”的切块与节奏配置。
+//
+// 字段语义：
+// 1. MinChunkRunes：达到该最小长度后，若命中标点/换行等边界，可提前切块；
+// 2. MaxChunkRunes：单块最大 rune 数，超过后强制切块，避免一次性发太长；
+// 3. ChunkInterval：块与块之间的等待时间；为 0 时表示只做切块，不做人为延迟。
+type PseudoStreamOptions struct {
+	MinChunkRunes int
+	MaxChunkRunes int
+	ChunkInterval time.Duration
+}
+
+const (
+	defaultPseudoStreamMinChunkRunes = 8
+	defaultPseudoStreamMaxChunkRunes = 24
+)
+
+// DefaultPseudoStreamOptions 返回一份适合中文短句展示的默认伪流式配置。
+func DefaultPseudoStreamOptions() PseudoStreamOptions {
+	return PseudoStreamOptions{
+		MinChunkRunes: defaultPseudoStreamMinChunkRunes,
+		MaxChunkRunes: defaultPseudoStreamMaxChunkRunes,
+	}
+}
+
+// ChunkEmitter 是 newAgent 统一的 SSE chunk 发射器。
+//
+// 职责边界：
+// 1. 负责把“正文 / 思考 / 工具事件 / 确认请求 / 中断提示”统一转换成 OpenAI 兼容 payload；
+// 2. 负责在必要时把结构化事件附带成 extra，同时给当前前端提供可读的降级文本；
+// 3. 不负责决定什么时候发什么，也不负责持久化状态。
+type ChunkEmitter struct {
+	emit      PayloadEmitter
+	RequestID string
+	ModelName string
+	Created   int64
+}
+
 // NoopPayloadEmitter 返回一个空实现，便于骨架期安全占位。
 func NoopPayloadEmitter() PayloadEmitter {
 	return func(string) error { return nil }
@@ -34,69 +79,320 @@ func WrapStageEmitter(fn func(stage, detail string)) StageEmitter {
 	return fn
 }

-// EmitStageAsReasoning 把“阶段提示”伪装成 reasoning chunk 推给前端。
+// NewChunkEmitter 创建统一 chunk 发射器。
 //
-// 设计背景：
-// 1. 你当前 Apifox 只认思考块和正文块，因此阶段提示需要先借 reasoning_content 走通；
-// 2. 这样后续真正前端上线时，只需要在这一层换协议，而不必回到各 skill 重改 graph；
-// 3. 这里不拼花哨格式，只给出稳定、可读、可 grep 的文本。
-func EmitStageAsReasoning(emit PayloadEmitter, requestID, modelName string, created int64, stage, detail string, includeRole bool) error {
+// 兜底策略：
+// 1. emit 为空时回退到 Noop，避免骨架期到处判空；
+// 2. modelName 为空时回填 worker，保持 OpenAI 兼容字段稳定；
+// 3. created <= 0 时用当前时间兜底，避免上层还没决定时间戳就无法复用。
+func NewChunkEmitter(emit PayloadEmitter, requestID, modelName string, created int64) *ChunkEmitter {
 	if emit == nil {
+		emit = NoopPayloadEmitter()
+	}
+
+	modelName = strings.TrimSpace(modelName)
+	if modelName == "" {
+		modelName = "worker"
+	}
+	if created <= 0 {
+		created = time.Now().Unix()
+	}
+
+	return &ChunkEmitter{
+		emit:      emit,
+		RequestID: strings.TrimSpace(requestID),
+		ModelName: modelName,
+		Created:   created,
+	}
+}
+
+// EmitReasoningText 输出一段 reasoning 文字，并附带 reasoning_text extra。
+func (e *ChunkEmitter) EmitReasoningText(blockID, stage, text string, includeRole bool) error {
+	if e == nil || e.emit == nil {
 		return nil
 	}

-	text := BuildStageReasoningText(stage, detail)
-	payload, err := ToOpenAIReasoningChunk(requestID, modelName, created, text, includeRole)
+	text = strings.TrimSpace(text)
+	if text == "" {
+		return nil
+	}
+
+	payload, err := ToOpenAIReasoningChunkWithExtra(
+		e.RequestID,
+		e.ModelName,
+		e.Created,
+		text,
+		includeRole,
+		NewReasoningTextExtra(blockID, stage),
+	)
 	if err != nil {
 		return err
 	}
 	if payload == "" {
 		return nil
 	}
-	return emit(payload)
+	return e.emit(payload)
+}
+
+// EmitAssistantText 输出一段 assistant 正文，并附带 assistant_text extra。
+func (e *ChunkEmitter) EmitAssistantText(blockID, stage, text string, includeRole bool) error {
+	if e == nil || e.emit == nil {
+		return nil
+	}
+
+	text = strings.TrimSpace(text)
+	if text == "" {
+		return nil
+	}
+
+	payload, err := ToOpenAIAssistantChunkWithExtra(
+		e.RequestID,
+		e.ModelName,
+		e.Created,
+		text,
+		includeRole,
+		NewAssistantTextExtra(blockID, stage),
+	)
+	if err != nil {
+		return err
+	}
+	if payload == "" {
+		return nil
+	}
+	return e.emit(payload)
+}
+
+// EmitPseudoReasoningText 把整段 reasoning 文本按伪流式方式逐块推出。
+func (e *ChunkEmitter) EmitPseudoReasoningText(ctx context.Context, blockID, stage, text string, options PseudoStreamOptions) error {
+	return e.emitPseudoText(
+		ctx,
+		text,
+		options,
+		func(chunk string, includeRole bool) error {
+			return e.EmitReasoningText(blockID, stage, chunk, includeRole)
+		},
+	)
+}
+
+// EmitPseudoAssistantText 把整段 assistant 文本按伪流式方式逐块推出。
+func (e *ChunkEmitter) EmitPseudoAssistantText(ctx context.Context, blockID, stage, text string, options PseudoStreamOptions) error {
+	return e.emitPseudoText(
+		ctx,
+		text,
+		options,
+		func(chunk string, includeRole bool) error {
+			return e.EmitAssistantText(blockID, stage, chunk, includeRole)
+		},
+	)
+}
+
+// EmitStatus 输出一条阶段状态事件。
+//
+// 当前兼容策略：
+// 1. extra 用 status 表达结构化语义；
+// 2. reasoning_content 里同时放一份可读降级文本，保证旧前端也能看到。
+func (e *ChunkEmitter) EmitStatus(blockID, stage, code, summary string, includeRole bool) error {
+	if e == nil || e.emit == nil {
+		return nil
+	}
+
+	text := BuildStageReasoningText(stage, summary)
+	payload, err := ToOpenAIReasoningChunkWithExtra(
+		e.RequestID,
+		e.ModelName,
+		e.Created,
+		text,
+		includeRole,
+		NewStatusExtra(blockID, stage, code, summary),
+	)
+	if err != nil {
+		return err
+	}
+	if payload == "" {
+		return nil
+	}
+	return e.emit(payload)
+}
+
+// EmitToolCallStart 输出一次工具调用开始事件。
+func (e *ChunkEmitter) EmitToolCallStart(blockID, stage, toolName, summary, argumentsPreview string, includeRole bool) error {
+	if e == nil || e.emit == nil {
+		return nil
+	}
+
+	text := BuildToolCallReasoningText(toolName, summary, argumentsPreview)
+	payload, err := ToOpenAIReasoningChunkWithExtra(
+		e.RequestID,
+		e.ModelName,
+		e.Created,
+		text,
+		includeRole,
+		NewToolCallExtra(blockID, stage, toolName, "start", summary, argumentsPreview),
+	)
+	if err != nil {
+		return err
+	}
+	if payload == "" {
+		return nil
+	}
+	return e.emit(payload)
+}
+
+// EmitToolCallResult 输出一次工具调用结果事件。
+func (e *ChunkEmitter) EmitToolCallResult(blockID, stage, toolName, summary, argumentsPreview string, includeRole bool) error {
+	if e == nil || e.emit == nil {
+		return nil
+	}
+
+	text := BuildToolResultReasoningText(toolName, summary)
+	payload, err := ToOpenAIReasoningChunkWithExtra(
+		e.RequestID,
+		e.ModelName,
+		e.Created,
+		text,
+		includeRole,
+		NewToolResultExtra(blockID, stage, toolName, "done", summary, argumentsPreview),
+	)
+	if err != nil {
+		return err
+	}
+	if payload == "" {
+		return nil
+	}
+	return e.emit(payload)
+}
+
+// EmitConfirmRequest 输出一次待确认事件。
+//
+// 当前展示策略：
+// 1. 对旧前端，confirm 文案通过 assistant content 直接可见；
+// 2. 对新前端，extra.confirm 可直接驱动确认卡片或按钮；
+// 3. 默认使用伪流式，避免确认文案整块砸下来太生硬。
+func (e *ChunkEmitter) EmitConfirmRequest(ctx context.Context, blockID, stage, interactionID, title, summary string, options PseudoStreamOptions) error {
+	if e == nil || e.emit == nil {
+		return nil
+	}
+
+	text := BuildConfirmAssistantText(title, summary)
+	extra := NewConfirmRequestExtra(blockID, stage, interactionID, title, summary)
+	return e.emitPseudoText(
+		ctx,
+		text,
+		options,
+		func(chunk string, includeRole bool) error {
+			payload, err := ToOpenAIAssistantChunkWithExtra(
+				e.RequestID,
+				e.ModelName,
+				e.Created,
+				chunk,
+				includeRole,
+				extra,
+			)
+			if err != nil {
+				return err
+			}
+			if payload == "" {
+				return nil
+			}
+			return e.emit(payload)
+		},
+	)
+}
+
+// EmitInterruptMessage 输出一次中断提示。
+//
+// 适用场景：
+// 1. ask_user 追问；
+// 2. 告知用户当前会话已进入等待状态；
+// 3. 后续 connection_lost 恢复若需要对用户补一句解释，也可复用这一入口。
+func (e *ChunkEmitter) EmitInterruptMessage(ctx context.Context, blockID, stage, interactionID, interactionType, summary string, options PseudoStreamOptions) error {
+	if e == nil || e.emit == nil {
+		return nil
+	}
+
+	text := BuildInterruptAssistantText(interactionType, summary)
+	extra := NewInterruptExtra(blockID, stage, interactionID, interactionType, summary)
+	return e.emitPseudoText(
+		ctx,
+		text,
+		options,
+		func(chunk string, includeRole bool) error {
+			payload, err := ToOpenAIAssistantChunkWithExtra(
+				e.RequestID,
+				e.ModelName,
+				e.Created,
+				chunk,
+				includeRole,
+				extra,
+			)
+			if err != nil {
+				return err
+			}
+			if payload == "" {
+				return nil
+			}
+			return e.emit(payload)
+		},
+	)
+}
+
+// EmitFinish 统一输出 stop 结束块，并带上 finish extra。
+func (e *ChunkEmitter) EmitFinish(blockID, stage string) error {
+	if e == nil || e.emit == nil {
+		return nil
+	}
+
+	payload, err := ToOpenAIFinishStreamWithExtra(
+		e.RequestID,
+		e.ModelName,
+		e.Created,
+		NewFinishExtra(blockID, stage),
+	)
+	if err != nil {
+		return err
+	}
+	if payload == "" {
+		return nil
+	}
+	return e.emit(payload)
+}
+
+// EmitDone 统一输出 OpenAI 兼容流式结束标记。
+func (e *ChunkEmitter) EmitDone() error {
+	if e == nil || e.emit == nil {
+		return nil
+	}
+	return e.emit("[DONE]")
+}
+
+// EmitStageAsReasoning 把“阶段提示”伪装成 reasoning chunk 推给前端。
+//
+// 兼容说明：
+// 1. 保留旧函数签名，方便当前旧链路直接复用；
+// 2. 实际实现已升级为统一的 ChunkEmitter + status extra；
+// 3. 这样后续新链路可以直接跳过这个兼容函数，转用结构化方法。
+func EmitStageAsReasoning(emit PayloadEmitter, requestID, modelName string, created int64, stage, detail string, includeRole bool) error {
+	return NewChunkEmitter(emit, requestID, modelName, created).EmitStatus(stage, stage, stage, detail, includeRole)
 }

 // EmitAssistantReply 把一段完整正文作为 assistant chunk 推出。
 //
 // 注意：
-// 1. 这里是“整段发”，不是把文本强行拆碎；
-// 2. 这样后续如果某条链路不需要真流式，也可以复用统一出口；
-// 3. 真正按 token/chunk 细粒度流式输出，应由 llm.Stream + 上层循环处理。
+// 1. 这里保持“整段发”，不主动切块；
+// 2. 若后续某条链路需要更自然的阅读节奏，应直接调用 EmitPseudoAssistantText；
+// 3. 为兼容老调用侧，这里 blockID 和 stage 都留空。
 func EmitAssistantReply(emit PayloadEmitter, requestID, modelName string, created int64, content string, includeRole bool) error {
-	if emit == nil {
-		return nil
-	}
-	payload, err := ToOpenAIAssistantChunk(requestID, modelName, created, content, includeRole)
-	if err != nil {
-		return err
-	}
-	if payload == "" {
-		return nil
-	}
-	return emit(payload)
+	return NewChunkEmitter(emit, requestID, modelName, created).EmitAssistantText("", "", content, includeRole)
 }

 // EmitFinish 统一输出 stop 结束块。
 func EmitFinish(emit PayloadEmitter, requestID, modelName string, created int64) error {
-	if emit == nil {
-		return nil
-	}
-	payload, err := ToOpenAIFinishStream(requestID, modelName, created)
-	if err != nil {
-		return err
-	}
-	if payload == "" {
-		return nil
-	}
-	return emit(payload)
+	return NewChunkEmitter(emit, requestID, modelName, created).EmitFinish("", "")
 }

 // EmitDone 统一输出 OpenAI 兼容流式结束标记。
 func EmitDone(emit PayloadEmitter) error {
-	if emit == nil {
-		return nil
-	}
-	return emit("[DONE]")
+	return NewChunkEmitter(emit, "", "", 0).EmitDone()
 }

 // BuildStageReasoningText 生成统一阶段提示文本。
@@ -113,3 +409,187 @@ func BuildStageReasoningText(stage, detail string) string {
 		return detail
 	}
 }
+
+// BuildToolCallReasoningText 生成“工具调用开始”时的可读提示文本。
+func BuildToolCallReasoningText(toolName, summary, argumentsPreview string) string {
+	toolName = strings.TrimSpace(toolName)
+	summary = strings.TrimSpace(summary)
+	argumentsPreview = strings.TrimSpace(argumentsPreview)
+
+	lines := make([]string, 0, 3)
+	if toolName != "" {
+		lines = append(lines, fmt.Sprintf("正在调用工具：%s", toolName))
+	}
+	if summary != "" {
+		lines = append(lines, summary)
+	}
+	if argumentsPreview != "" {
+		lines = append(lines, fmt.Sprintf("参数摘要：%s", argumentsPreview))
+	}
+	return strings.TrimSpace(strings.Join(lines, "\n"))
+}
+
+// BuildToolResultReasoningText 生成“工具调用结果”时的可读提示文本。
+func BuildToolResultReasoningText(toolName, summary string) string {
+	toolName = strings.TrimSpace(toolName)
+	summary = strings.TrimSpace(summary)
+
+	switch {
+	case toolName != "" && summary != "":
+		return fmt.Sprintf("工具结果：%s\n%s", toolName, summary)
+	case toolName != "":
+		return fmt.Sprintf("工具结果：%s", toolName)
+	default:
+		return summary
+	}
+}
+
+// BuildConfirmAssistantText 生成给用户看的确认文案。
+func BuildConfirmAssistantText(title, summary string) string {
+	title = strings.TrimSpace(title)
+	summary = strings.TrimSpace(summary)
+
+	switch {
+	case title != "" && summary != "":
+		return fmt.Sprintf("%s\n%s", title, summary)
+	case title != "":
+		return title
+	default:
+		return summary
+	}
+}
+
+// BuildInterruptAssistantText 生成给用户看的中断文案。
+func BuildInterruptAssistantText(interactionType, summary string) string {
+	interactionType = strings.TrimSpace(interactionType)
+	summary = strings.TrimSpace(summary)
+
+	switch {
+	case interactionType != "" && summary != "":
+		return fmt.Sprintf("当前进入 %s 阶段。\n%s", interactionType, summary)
+	case summary != "":
+		return summary
+	default:
+		return interactionType
+	}
+}
+
+func (e *ChunkEmitter) emitPseudoText(ctx context.Context, text string, options PseudoStreamOptions, emitChunk func(chunk string, includeRole bool) error) error {
+	if emitChunk == nil {
+		return nil
+	}
+	text = strings.TrimSpace(text)
+	if text == "" {
+		return nil
+	}
+
+	chunks := SplitPseudoStreamText(text, options)
+	for i, chunk := range chunks {
+		if err := emitChunk(chunk, i == 0); err != nil {
+			return err
+		}
+		if i < len(chunks)-1 {
+			if err := waitPseudoStreamInterval(ctx, options.ChunkInterval); err != nil {
+				return err
+			}
+		}
+	}
+	return nil
+}
+
+// SplitPseudoStreamText 按“标点优先、长度兜底”的策略切分整段文本。
+//
+// 步骤说明：
+// 1. 优先在句号、问号、感叹号、分号、换行等自然边界切块，保证阅读顺畅；
+// 2. 若长时间遇不到合适边界，则在 MaxChunkRunes 处强制切块，避免整段卡太久；
+// 3. 对中文文本优先按 rune 长度处理，避免多字节字符被截断。
+func SplitPseudoStreamText(text string, options PseudoStreamOptions) []string {
+	text = strings.TrimSpace(text)
+	if text == "" {
+		return nil
+	}
+
+	options = normalizePseudoStreamOptions(options)
+	runes := []rune(text)
+	if len(runes) <= options.MaxChunkRunes {
+		return []string{text}
+	}
+
+	chunks := make([]string, 0, len(runes)/options.MinChunkRunes+1)
+	start := 0
+	size := 0
+	for i, r := range runes {
+		size++
+
+		shouldFlush := false
+		if size >= options.MaxChunkRunes {
+			shouldFlush = true
+		}
+		if size >= options.MinChunkRunes && isPseudoStreamBoundary(r) {
+			shouldFlush = true
+		}
+		if !shouldFlush {
+			continue
+		}
+
+		chunk := strings.TrimSpace(string(runes[start : i+1]))
+		if chunk != "" {
+			chunks = append(chunks, chunk)
+		}
+		start = i + 1
+		size = 0
+	}
+
+	if start < len(runes) {
+		chunk := strings.TrimSpace(string(runes[start:]))
+		if chunk != "" {
+			chunks = append(chunks, chunk)
+		}
+	}
+
+	if len(chunks) == 0 {
+		return []string{text}
+	}
+	return chunks
+}
+
+func normalizePseudoStreamOptions(options PseudoStreamOptions) PseudoStreamOptions {
+	if options.MinChunkRunes <= 0 {
+		options.MinChunkRunes = defaultPseudoStreamMinChunkRunes
+	}
+	if options.MaxChunkRunes <= 0 {
+		options.MaxChunkRunes = defaultPseudoStreamMaxChunkRunes
+	}
+	if options.MaxChunkRunes < options.MinChunkRunes {
+		options.MaxChunkRunes = options.MinChunkRunes
+	}
+	return options
+}
+
+func isPseudoStreamBoundary(r rune) bool {
+	switch r {
+	case '。', '！', '？', '；', '：', '，', '.', '!', '?', ';', ':', ',', '\n':
+		return true
+	default:
+		return false
+	}
+}
+
+func waitPseudoStreamInterval(ctx context.Context, interval time.Duration) error {
+	if interval <= 0 {
+		return nil
+	}
+	if ctx == nil {
+		ctx = context.Background()
+	}
+
+	timer := time.NewTimer(interval)
+	defer timer.Stop()
+
+	select {
+	case <-ctx.Done():
+		return ctx.Err()
+	case <-timer.C:
+		return nil
+	}
+}
--- a/backend/newAgent/stream/openai.go
+++ b/backend/newAgent/stream/openai.go
@@ -8,16 +8,17 @@ import (

 // OpenAIChunkResponse 是 OpenAI 兼容的流式 chunk DTO。
 //
-// 之所以单独放到 Agent/stream：
-// 1. 未来无论 quicknote、taskquery 还是 schedule，只要需要 SSE 都会复用这套协议壳；
-// 2. 这样 node/graph 层只关注“我要推什么内容”，不再自己拼 JSON；
-// 3. 后续如果前端协议升级，也能在这里集中改。
+// 设计说明：
+// 1. 外层继续保持 OpenAI 兼容壳，避免前端和调试工具一次性大改；
+// 2. 新增顶层 Extra 字段，用来承载“工具调用 / 确认请求 / 中断恢复”等结构化事件；
+// 3. 这样旧前端仍可继续读取 delta.content / delta.reasoning_content，新前端则可渐进消费 extra。
 type OpenAIChunkResponse struct {
 	ID      string              `json:"id"`
 	Object  string              `json:"object"`
 	Created int64               `json:"created"`
 	Model   string              `json:"model"`
-	Choices []OpenAIChunkChoice `json:"choices"`
+	Choices []OpenAIChunkChoice `json:"choices,omitempty"`
+	Extra   *OpenAIChunkExtra   `json:"extra,omitempty"`
 }

 // OpenAIChunkChoice 对应 OpenAI choices[0]。
@@ -34,13 +35,87 @@ type OpenAIChunkDelta struct {
 	ReasoningContent string `json:"reasoning_content,omitempty"`
 }

+// StreamExtraKind 表示当前 chunk 在业务语义上属于哪类事件。
+type StreamExtraKind string
+
+const (
+	StreamExtraKindReasoningText StreamExtraKind = "reasoning_text"
+	StreamExtraKindAssistantText StreamExtraKind = "assistant_text"
+	StreamExtraKindStatus        StreamExtraKind = "status"
+	StreamExtraKindToolCall      StreamExtraKind = "tool_call"
+	StreamExtraKindToolResult    StreamExtraKind = "tool_result"
+	StreamExtraKindConfirm       StreamExtraKind = "confirm_request"
+	StreamExtraKindInterrupt     StreamExtraKind = "interrupt"
+	StreamExtraKindFinish        StreamExtraKind = "finish"
+)
+
+// StreamDisplayMode 表示前端更适合如何展示该结构化事件。
+type StreamDisplayMode string
+
+const (
+	StreamDisplayModeAppend  StreamDisplayMode = "append"
+	StreamDisplayModeReplace StreamDisplayMode = "replace"
+	StreamDisplayModeCard    StreamDisplayMode = "card"
+)
+
+// OpenAIChunkExtra 是挂在 OpenAI 兼容壳上的结构化扩展字段。
+//
+// 职责边界：
+// 1. Kind / Stage / BlockID 提供前端排版和分组所需的最小元信息；
+// 2. Status / Tool / Confirm / Interrupt 只存展示层真正需要的摘要，不直接耦合后端完整状态对象；
+// 3. Meta 留给后续做灰度扩展，避免每加一种小字段都要立刻改 DTO 结构。
+type OpenAIChunkExtra struct {
+	Kind        StreamExtraKind       `json:"kind,omitempty"`
+	BlockID     string                `json:"block_id,omitempty"`
+	Stage       string                `json:"stage,omitempty"`
+	DisplayMode StreamDisplayMode     `json:"display_mode,omitempty"`
+	Status      *StreamStatusExtra    `json:"status,omitempty"`
+	Tool        *StreamToolExtra      `json:"tool,omitempty"`
+	Confirm     *StreamConfirmExtra   `json:"confirm,omitempty"`
+	Interrupt   *StreamInterruptExtra `json:"interrupt,omitempty"`
+	Meta        map[string]any        `json:"meta,omitempty"`
+}
+
+// StreamStatusExtra 表示普通阶段状态或提示性事件。
+type StreamStatusExtra struct {
+	Code    string `json:"code,omitempty"`
+	Summary string `json:"summary,omitempty"`
+}
+
+// StreamToolExtra 表示一次工具调用相关事件。
+type StreamToolExtra struct {
+	Name             string `json:"name,omitempty"`
+	Status           string `json:"status,omitempty"`
+	Summary          string `json:"summary,omitempty"`
+	ArgumentsPreview string `json:"arguments_preview,omitempty"`
+}
+
+// StreamConfirmExtra 表示一次待确认事件的展示摘要。
+type StreamConfirmExtra struct {
+	InteractionID string `json:"interaction_id,omitempty"`
+	Title         string `json:"title,omitempty"`
+	Summary       string `json:"summary,omitempty"`
+}
+
+// StreamInterruptExtra 表示一次中断事件的展示摘要。
+type StreamInterruptExtra struct {
+	InteractionID string `json:"interaction_id,omitempty"`
+	Type          string `json:"type,omitempty"`
+	Summary       string `json:"summary,omitempty"`
+}
+
 // ToOpenAIStream 把 Eino message 转成 OpenAI 兼容 chunk。
+func ToOpenAIStream(chunk *schema.Message, requestID, modelName string, created int64, includeRole bool) (string, error) {
+	return ToOpenAIStreamWithExtra(chunk, requestID, modelName, created, includeRole, nil)
+}
+
+// ToOpenAIStreamWithExtra 把 Eino message 转成带 extra 的 OpenAI 兼容 chunk。
 //
 // 职责边界：
 // 1. 负责把 chunk.Content / chunk.ReasoningContent 映射到协议字段；
-// 2. 负责按 includeRole 决定是否在首块带上 assistant 角色；
+// 2. 负责挂载可选 extra，供前端识别工具调用、确认请求等结构化事件；
 // 3. 不负责发送，也不负责决定“这个 chunk 该不该推”。
-func ToOpenAIStream(chunk *schema.Message, requestID, modelName string, created int64, includeRole bool) (string, error) {
+func ToOpenAIStreamWithExtra(chunk *schema.Message, requestID, modelName string, created int64, includeRole bool, extra *OpenAIChunkExtra) (string, error) {
 	delta := OpenAIChunkDelta{}
 	if includeRole {
 		delta.Role = "assistant"
@@ -49,50 +124,177 @@ func ToOpenAIStream(chunk *schema.Message, requestID, modelName string, created
 		delta.Content = chunk.Content
 		delta.ReasoningContent = chunk.ReasoningContent
 	}
-	return buildOpenAIChunkPayload(requestID, modelName, created, delta, nil)
+	return buildOpenAIChunkPayload(requestID, modelName, created, delta, nil, extra)
 }

 // ToOpenAIReasoningChunk 直接构造一个 reasoning chunk。
 func ToOpenAIReasoningChunk(requestID, modelName string, created int64, reasoning string, includeRole bool) (string, error) {
+	return ToOpenAIReasoningChunkWithExtra(requestID, modelName, created, reasoning, includeRole, nil)
+}
+
+// ToOpenAIReasoningChunkWithExtra 直接构造一个带 extra 的 reasoning chunk。
+func ToOpenAIReasoningChunkWithExtra(requestID, modelName string, created int64, reasoning string, includeRole bool, extra *OpenAIChunkExtra) (string, error) {
 	delta := OpenAIChunkDelta{ReasoningContent: reasoning}
 	if includeRole {
 		delta.Role = "assistant"
 	}
-	return buildOpenAIChunkPayload(requestID, modelName, created, delta, nil)
+	return buildOpenAIChunkPayload(requestID, modelName, created, delta, nil, extra)
 }

 // ToOpenAIAssistantChunk 直接构造一个正文 chunk。
 func ToOpenAIAssistantChunk(requestID, modelName string, created int64, content string, includeRole bool) (string, error) {
+	return ToOpenAIAssistantChunkWithExtra(requestID, modelName, created, content, includeRole, nil)
+}
+
+// ToOpenAIAssistantChunkWithExtra 直接构造一个带 extra 的正文 chunk。
+func ToOpenAIAssistantChunkWithExtra(requestID, modelName string, created int64, content string, includeRole bool, extra *OpenAIChunkExtra) (string, error) {
 	delta := OpenAIChunkDelta{Content: content}
 	if includeRole {
 		delta.Role = "assistant"
 	}
-	return buildOpenAIChunkPayload(requestID, modelName, created, delta, nil)
+	return buildOpenAIChunkPayload(requestID, modelName, created, delta, nil, extra)
 }

 // ToOpenAIFinishStream 生成流式结束 chunk（finish_reason=stop）。
 func ToOpenAIFinishStream(requestID, modelName string, created int64) (string, error) {
-	stop := "stop"
-	return buildOpenAIChunkPayload(requestID, modelName, created, OpenAIChunkDelta{}, &stop)
+	return ToOpenAIFinishStreamWithExtra(requestID, modelName, created, nil)
 }

-func buildOpenAIChunkPayload(requestID, modelName string, created int64, delta OpenAIChunkDelta, finishReason *string) (string, error) {
-	// 1. 若既没有 role，也没有正文/思考，也没有 finish_reason，则视为“空块”，直接跳过。
-	// 2. 这样可以避免上层每次都自己写一遍空块判断。
-	if delta.Role == "" && delta.Content == "" && delta.ReasoningContent == "" && finishReason == nil {
+// ToOpenAIFinishStreamWithExtra 生成带 extra 的流式结束 chunk。
+func ToOpenAIFinishStreamWithExtra(requestID, modelName string, created int64, extra *OpenAIChunkExtra) (string, error) {
+	stop := "stop"
+	return buildOpenAIChunkPayload(requestID, modelName, created, OpenAIChunkDelta{}, &stop, extra)
+}
+
+// NewReasoningTextExtra 创建“思考文字”事件的 extra。
+func NewReasoningTextExtra(blockID, stage string) *OpenAIChunkExtra {
+	return &OpenAIChunkExtra{
+		Kind:        StreamExtraKindReasoningText,
+		BlockID:     blockID,
+		Stage:       stage,
+		DisplayMode: StreamDisplayModeAppend,
+	}
+}
+
+// NewAssistantTextExtra 创建“正文文字”事件的 extra。
+func NewAssistantTextExtra(blockID, stage string) *OpenAIChunkExtra {
+	return &OpenAIChunkExtra{
+		Kind:        StreamExtraKindAssistantText,
+		BlockID:     blockID,
+		Stage:       stage,
+		DisplayMode: StreamDisplayModeAppend,
+	}
+}
+
+// NewStatusExtra 创建普通状态事件的 extra。
+func NewStatusExtra(blockID, stage, code, summary string) *OpenAIChunkExtra {
+	return &OpenAIChunkExtra{
+		Kind:        StreamExtraKindStatus,
+		BlockID:     blockID,
+		Stage:       stage,
+		DisplayMode: StreamDisplayModeCard,
+		Status: &StreamStatusExtra{
+			Code:    code,
+			Summary: summary,
+		},
+	}
+}
+
+// NewToolCallExtra 创建“工具调用开始/中间态”事件的 extra。
+func NewToolCallExtra(blockID, stage, toolName, status, summary, argumentsPreview string) *OpenAIChunkExtra {
+	return &OpenAIChunkExtra{
+		Kind:        StreamExtraKindToolCall,
+		BlockID:     blockID,
+		Stage:       stage,
+		DisplayMode: StreamDisplayModeCard,
+		Tool: &StreamToolExtra{
+			Name:             toolName,
+			Status:           status,
+			Summary:          summary,
+			ArgumentsPreview: argumentsPreview,
+		},
+	}
+}
+
+// NewToolResultExtra 创建“工具结果”事件的 extra。
+func NewToolResultExtra(blockID, stage, toolName, status, summary, argumentsPreview string) *OpenAIChunkExtra {
+	return &OpenAIChunkExtra{
+		Kind:        StreamExtraKindToolResult,
+		BlockID:     blockID,
+		Stage:       stage,
+		DisplayMode: StreamDisplayModeCard,
+		Tool: &StreamToolExtra{
+			Name:             toolName,
+			Status:           status,
+			Summary:          summary,
+			ArgumentsPreview: argumentsPreview,
+		},
+	}
+}
+
+// NewConfirmRequestExtra 创建“待确认”事件的 extra。
+func NewConfirmRequestExtra(blockID, stage, interactionID, title, summary string) *OpenAIChunkExtra {
+	return &OpenAIChunkExtra{
+		Kind:        StreamExtraKindConfirm,
+		BlockID:     blockID,
+		Stage:       stage,
+		DisplayMode: StreamDisplayModeCard,
+		Confirm: &StreamConfirmExtra{
+			InteractionID: interactionID,
+			Title:         title,
+			Summary:       summary,
+		},
+	}
+}
+
+// NewInterruptExtra 创建“中断”事件的 extra。
+func NewInterruptExtra(blockID, stage, interactionID, interactionType, summary string) *OpenAIChunkExtra {
+	return &OpenAIChunkExtra{
+		Kind:        StreamExtraKindInterrupt,
+		BlockID:     blockID,
+		Stage:       stage,
+		DisplayMode: StreamDisplayModeCard,
+		Interrupt: &StreamInterruptExtra{
+			InteractionID: interactionID,
+			Type:          interactionType,
+			Summary:       summary,
+		},
+	}
+}
+
+// NewFinishExtra 创建“收尾完成”事件的 extra。
+func NewFinishExtra(blockID, stage string) *OpenAIChunkExtra {
+	return &OpenAIChunkExtra{
+		Kind:        StreamExtraKindFinish,
+		BlockID:     blockID,
+		Stage:       stage,
+		DisplayMode: StreamDisplayModeReplace,
+	}
+}
+
+func buildOpenAIChunkPayload(requestID, modelName string, created int64, delta OpenAIChunkDelta, finishReason *string, extra *OpenAIChunkExtra) (string, error) {
+	// 1. 若既没有 role，也没有正文/思考，也没有 finish_reason，且也没有 extra，则视为“空块”，直接跳过。
+	// 2. 这样后续 emitter 即使拆成“结构化事件 + 文本事件”双轨，也能复用统一的空块兜底。
+	if delta.Role == "" && delta.Content == "" && delta.ReasoningContent == "" && finishReason == nil && !hasStreamExtra(extra) {
 		return "", nil
 	}

+	choices := make([]OpenAIChunkChoice, 0, 1)
+	if delta.Role != "" || delta.Content != "" || delta.ReasoningContent != "" || finishReason != nil {
+		choices = append(choices, OpenAIChunkChoice{
+			Index:        0,
+			Delta:        delta,
+			FinishReason: finishReason,
+		})
+	}
+
 	dto := OpenAIChunkResponse{
 		ID:      requestID,
 		Object:  "chat.completion.chunk",
 		Created: created,
 		Model:   modelName,
-		Choices: []OpenAIChunkChoice{{
-			Index:        0,
-			Delta:        delta,
-			FinishReason: finishReason,
-		}},
+		Choices: choices,
+		Extra:   extra,
 	}
 	data, err := json.Marshal(dto)
 	if err != nil {
@@ -100,3 +302,18 @@ func buildOpenAIChunkPayload(requestID, modelName string, created int64, delta O
 	}
 	return string(data), nil
 }
+
+func hasStreamExtra(extra *OpenAIChunkExtra) bool {
+	if extra == nil {
+		return false
+	}
+	return extra.Kind != "" ||
+		extra.BlockID != "" ||
+		extra.Stage != "" ||
+		extra.DisplayMode != "" ||
+		extra.Status != nil ||
+		extra.Tool != nil ||
+		extra.Confirm != nil ||
+		extra.Interrupt != nil ||
+		len(extra.Meta) > 0
+}