feat：优化对多模态/非多模态replyer的配置

2026-04-11 19:30:23 +08:00
parent c0230fc313
commit d9b3440169
12 changed files with 150 additions and 44 deletions
--- a/src/maisaka/builtin_tool/send_emoji.py
+++ b/src/maisaka/builtin_tool/send_emoji.py
@@ -2,11 +2,11 @@

 from datetime import datetime
 from io import BytesIO
-import math
 from random import sample
 from typing import Any, Dict, Optional

 import asyncio
+import math

 from PIL import Image as PILImage
 from PIL import ImageDraw, ImageFont
@@ -20,12 +20,14 @@ from src.common.logger import get_logger
 from src.config.config import global_config
 from src.core.tooling import ToolExecutionContext, ToolExecutionResult, ToolInvocation, ToolSpec
 from src.llm_models.payload_content.resp_format import RespFormat, RespFormatType
+from src.llm_models.payload_content.message import MessageBuilder, RoleType
 from src.maisaka.context_messages import (
    LLMContextMessage,
    ReferenceMessage,
    ReferenceMessageType,
    SessionBackedMessage,
 )
+from src.plugin_runtime.hook_payloads import serialize_prompt_messages

 from .context import BuiltinToolRuntimeContext

@@ -270,6 +272,7 @@ def _build_send_emoji_prompt_preview(
 def _build_send_emoji_monitor_detail(
    *,
    prompt_text: str = "",
+    request_messages: Optional[list[dict[str, Any]]] = None,
    reasoning_text: str = "",
    output_text: str = "",
    metrics: Optional[Dict[str, Any]] = None,
@@ -280,6 +283,8 @@ def _build_send_emoji_monitor_detail(
    detail: Dict[str, Any] = {}
    if prompt_text.strip():
        detail["prompt_text"] = prompt_text.strip()
+    if isinstance(request_messages, list) and request_messages:
+        detail["request_messages"] = request_messages
    if reasoning_text.strip():
        detail["reasoning_text"] = reasoning_text.strip()
    if output_text.strip():
@@ -394,6 +399,16 @@ async def _select_emoji_with_sub_agent(
        grid_columns=grid_columns,
        sampled_emojis=sampled_emojis,
    )
+    request_messages = [
+        MessageBuilder().set_role(RoleType.System).add_text_content(system_prompt).build(),
+    ]
+    prompt_llm_message = prompt_message.to_llm_message()
+    if prompt_llm_message is not None:
+        request_messages.append(prompt_llm_message)
+    candidate_llm_message = candidate_message.to_llm_message()
+    if candidate_llm_message is not None:
+        request_messages.append(candidate_llm_message)
+    serialized_request_messages = serialize_prompt_messages(request_messages)

    selection_started_at = datetime.now()
    response = await tool_ctx.runtime.run_sub_agent(
@@ -422,6 +437,7 @@ async def _select_emoji_with_sub_agent(
        if selection_metadata is not None:
            selection_metadata["monitor_detail"] = _build_send_emoji_monitor_detail(
                prompt_text=prompt_preview,
+                request_messages=serialized_request_messages,
                output_text=response.content or "",
                metrics=selection_metrics,
                extra_sections=[{
@@ -436,6 +452,7 @@ async def _select_emoji_with_sub_agent(
        selection_metadata["reason"] = selection.reason.strip()
        selection_metadata["monitor_detail"] = _build_send_emoji_monitor_detail(
            prompt_text=prompt_preview,
+            request_messages=serialized_request_messages,
            reasoning_text=selection.reason,
            output_text=response.content or "",
            metrics=selection_metrics,
--- a/src/maisaka/display/prompt_cli_renderer.py
+++ b/src/maisaka/display/prompt_cli_renderer.py
@@ -440,6 +440,9 @@ class PromptCLIVisualizer:
        return (
            "<div class='image-card'>"
            f"<div class='image-meta'>图片 image/{html.escape(normalized_format)} {html.escape(size_text)}</div>"
+            f"<a class='image-preview-link' href='{html.escape(file_uri, quote=True)}'>"
+            f"<img class='image-preview' src='{html.escape(file_uri, quote=True)}' alt='图片预览' />"
+            "</a>"
            f"<div class='image-path'>{html.escape(str(file_path))}</div>"
            f"<a class='image-link' href='{html.escape(file_uri, quote=True)}'>打开图片</a>"
            "</div>"
@@ -727,6 +730,22 @@ class PromptCLIVisualizer:
      font-family: "Cascadia Mono", "JetBrains Mono", "Consolas", monospace;
      word-break: break-all;
    }}
+    .image-preview-link {{
+      display: block;
+      margin-top: 10px;
+    }}
+    .image-preview {{
+      display: block;
+      max-width: min(100%, 560px);
+      max-height: 420px;
+      width: auto;
+      height: auto;
+      border-radius: 12px;
+      border: 1px solid #dbe4f0;
+      background: #fff;
+      box-shadow: 0 8px 20px rgba(15, 23, 42, 0.08);
+      object-fit: contain;
+    }}
    .image-link {{
      display: inline-block;
      margin-top: 8px;