feat：修复表达方式的学习和使用，用subagent使用表达

1
2026-04-04 23:18:21 +08:00
parent 2fb911a8d5
commit 7b924774be
10 changed files with 497 additions and 569 deletions
--- a/src/chat/brain_chat/PFC/pfc_KnowledgeFetcher.py
+++ b/src/chat/brain_chat/PFC/pfc_KnowledgeFetcher.py
@@ -1,133 +0,0 @@
-from typing import Any, Dict, List, Tuple
-
-from src.chat.message_receive.chat_manager import chat_manager as _chat_manager
-from src.common.logger import get_logger
-
-from src.person_info.person_info import resolve_person_id_for_memory
-from src.services.memory_service import memory_service
-
-logger = get_logger("knowledge_fetcher")
-
-
-class KnowledgeFetcher:
-    """知识调取器"""
-
-    def __init__(self, private_name: str, stream_id: str):
-        self.private_name = private_name
-        self.stream_id = stream_id
-
-    def _resolve_private_memory_context(self) -> Dict[str, str]:
-        session = _chat_manager.get_session_by_session_id(self.stream_id)
-        if session is None:
-            return {"chat_id": self.stream_id}
-
-        group_id = str(getattr(session, "group_id", "") or "").strip()
-        user_id = str(getattr(session, "user_id", "") or "").strip()
-        platform = str(getattr(session, "platform", "") or "").strip()
-
-        person_id = ""
-        if not group_id:
-            try:
-                person_id = resolve_person_id_for_memory(
-                    person_name=self.private_name,
-                    platform=platform,
-                    user_id=user_id,
-                )
-            except Exception as exc:
-                logger.debug(f"[私聊][{self.private_name}]解析人物ID失败: {exc}")
-
-        return {
-            "chat_id": self.stream_id,
-            "person_id": person_id,
-            "user_id": user_id,
-            "group_id": group_id,
-        }
-
-    async def _memory_get_knowledge(self, query: str) -> str:
-        """获取相关知识
-
-        Args:
-            query: 查询内容
-
-        Returns:
-            str: 构造好的,带相关度的知识
-        """
-
-        logger.debug(f"[私聊][{self.private_name}]正在从长期记忆中获取知识")
-        try:
-            context = self._resolve_private_memory_context()
-            search_kwargs = {
-                "limit": 5,
-                "mode": "search",
-                "chat_id": context.get("chat_id", ""),
-                "person_id": context.get("person_id", ""),
-                "user_id": context.get("user_id", ""),
-                "group_id": context.get("group_id", ""),
-                "respect_filter": True,
-            }
-            result = await memory_service.search(query, **search_kwargs)
-            if not result.success:
-                logger.warning(
-                    f"[私聊][{self.private_name}]长期记忆查询失败: {result.error or '未知错误'}"
-                )
-                return f"长期记忆检索失败：{result.error or '未知错误'}"
-            if not result.filtered and not result.hits and search_kwargs["person_id"]:
-                fallback_kwargs = dict(search_kwargs)
-                fallback_kwargs["person_id"] = ""
-                logger.debug(f"[私聊][{self.private_name}]人物过滤未命中，退回仅按会话检索长期记忆")
-                result = await memory_service.search(query, **fallback_kwargs)
-                if not result.success:
-                    logger.warning(
-                        f"[私聊][{self.private_name}]长期记忆回退查询失败: {result.error or '未知错误'}"
-                    )
-                    return f"长期记忆检索失败：{result.error or '未知错误'}"
-            knowledge_info = result.to_text(limit=5)
-            if result.filtered:
-                logger.debug(f"[私聊][{self.private_name}]长期记忆查询被聊天过滤策略跳过")
-            else:
-                logger.debug(f"[私聊][{self.private_name}]长期记忆查询结果: {knowledge_info[:150]}")
-            return knowledge_info or "未找到匹配的知识"
-        except Exception as e:
-            logger.error(f"[私聊][{self.private_name}]长期记忆搜索工具执行失败: {str(e)}")
-            return "未找到匹配的知识"
-
-    async def fetch(self, query: str, chat_history: List[Dict[str, Any]]) -> Tuple[str, str]:
-        """获取相关知识
-
-        Args:
-            query: 查询内容
-            chat_history: 聊天历史 (PFC dict format)
-
-        Returns:
-            Tuple[str, str]: (获取的知识, 知识来源)
-        """
-        _ = chat_history
-
-        # NOTE: Hippocampus memory system was redesigned in v0.12.2
-        # The old get_memory_from_text API no longer exists
-        # For now, we'll skip the memory retrieval part and only use LPMM knowledge
-        # TODO: Integrate with new memory system if needed
-        knowledge_text = ""
-        sources_text = "无记忆匹配"  # 默认值
-
-        # # 从记忆中获取相关知识 (DISABLED - old Hippocampus API)
-        # related_memory = await HippocampusManager.get_instance().get_memory_from_text(
-        #     text=f"{query}\n{chat_history_text}",
-        #     max_memory_num=3,
-        #     max_memory_length=2,
-        #     max_depth=3,
-        #     fast_retrieval=False,
-        # )
-        # if related_memory:
-        #     sources = []
-        #     for memory in related_memory:
-        #         knowledge_text += memory[1] + "\n"
-        #         sources.append(f"记忆片段{memory[0]}")
-        #     knowledge_text = knowledge_text.strip()
-        #     sources_text = "，".join(sources)
-
-        knowledge_text += "\n现在有以下**知识**可供参考：\n "
-        knowledge_text += await self._memory_get_knowledge(query)
-        knowledge_text += "\n请记住这些**知识**，并根据**知识**回答问题。\n"
-
-        return knowledge_text or "未找到相关知识", sources_text or "无记忆匹配"
--- a/src/chat/replyer/maisaka_expression_selector.py
+++ b/src/chat/replyer/maisaka_expression_selector.py
@@ -0,0 +1,280 @@
+from dataclasses import dataclass, field
+from datetime import datetime
+import json
+from typing import Any, Awaitable, Callable, List, Optional
+
+from json_repair import repair_json
+from sqlmodel import select
+
+from src.chat.message_receive.message import SessionMessage
+from src.common.database.database import get_db_session
+from src.common.database.database_model import Expression
+from src.common.logger import get_logger
+from src.common.utils.utils_config import ExpressionConfigUtils
+from src.common.utils.utils_session import SessionUtils
+from src.config.config import global_config
+from src.learners.learner_utils_old import weighted_sample
+from src.maisaka.context_messages import LLMContextMessage
+
+logger = get_logger("maisaka_expression_selector")
+
+SubAgentRunner = Callable[[str], Awaitable[str]]
+
+
+@dataclass
+class MaisakaExpressionSelectionResult:
+    """Maisaka replyer 的表达方式选择结果。"""
+
+    expression_habits: str = ""
+    selected_expression_ids: List[int] = field(default_factory=list)
+
+
+class MaisakaExpressionSelector:
+    """负责在 replyer 侧完成表达方式筛选与子代理选择。"""
+
+    def _can_use_expressions(self, session_id: str) -> bool:
+        try:
+            use_expression, _, _ = ExpressionConfigUtils.get_expression_config_for_chat(session_id)
+            return use_expression
+        except Exception as exc:
+            logger.error(f"检查表达方式使用开关失败: {exc}")
+            return False
+
+    def _get_related_session_ids(self, session_id: str) -> List[str]:
+        related_session_ids = {session_id}
+        expression_groups = global_config.expression.expression_groups
+
+        for expression_group in expression_groups:
+            target_items = expression_group.expression_groups
+            group_session_ids: set[str] = set()
+            contains_current_session = False
+
+            for target_item in target_items:
+                platform = target_item.platform.strip()
+                item_id = target_item.item_id.strip()
+                if not platform or not item_id:
+                    continue
+
+                rule_type = target_item.rule_type
+                target_session_id = SessionUtils.calculate_session_id(
+                    platform,
+                    group_id=item_id if rule_type == "group" else None,
+                    user_id=None if rule_type == "group" else item_id,
+                )
+                group_session_ids.add(target_session_id)
+                if target_session_id == session_id:
+                    contains_current_session = True
+
+            if contains_current_session:
+                related_session_ids.update(group_session_ids)
+
+        return list(related_session_ids)
+
+    def _load_expression_candidates(self, session_id: str) -> List[dict[str, Any]]:
+        related_session_ids = self._get_related_session_ids(session_id)
+
+        with get_db_session(auto_commit=False) as session:
+            base_query = select(Expression).where(Expression.rejected.is_(False))  # type: ignore[attr-defined]
+            scoped_query = base_query.where(
+                (Expression.session_id.in_(related_session_ids)) | (Expression.session_id.is_(None))  # type: ignore[attr-defined]
+            )
+            if global_config.expression.expression_checked_only:
+                scoped_query = scoped_query.where(Expression.checked.is_(True))  # type: ignore[attr-defined]
+            expressions = session.exec(scoped_query).all()
+
+        all_candidates = [
+            {
+                "id": expression.id,
+                "situation": expression.situation,
+                "style": expression.style,
+                "count": expression.count if getattr(expression, "count", None) is not None else 1,
+            }
+            for expression in expressions
+            if expression.id is not None and expression.situation and expression.style
+        ]
+        if len(all_candidates) < 10:
+            return []
+
+        high_count_candidates = [item for item in all_candidates if (item.get("count", 1) or 1) > 1]
+        selected_high = (
+            weighted_sample(high_count_candidates, min(len(high_count_candidates), 5))
+            if len(high_count_candidates) >= 10
+            else []
+        )
+        selected_random = weighted_sample(all_candidates, min(len(all_candidates), 5))
+
+        candidate_pool: List[dict[str, Any]] = []
+        seen_ids: set[int] = set()
+        for candidate in [*selected_high, *selected_random]:
+            candidate_id = candidate.get("id")
+            if not isinstance(candidate_id, int) or candidate_id in seen_ids:
+                continue
+            seen_ids.add(candidate_id)
+            candidate_pool.append(candidate)
+
+        return candidate_pool
+
+    @staticmethod
+    def _format_candidate_preview(candidates: List[dict[str, Any]]) -> str:
+        """构建候选表达方式的简短日志预览。"""
+        preview_items: List[str] = []
+        for candidate in candidates[:5]:
+            candidate_id = candidate.get("id")
+            situation = str(candidate.get("situation") or "").strip()
+            style = str(candidate.get("style") or "").strip()
+            count = candidate.get("count")
+            preview_items.append(
+                f"id={candidate_id}, situation={situation!r}, style={style!r}, count={count}"
+            )
+        return "; ".join(preview_items)
+
+    @staticmethod
+    def _build_expression_habits_block(selected_expressions: List[dict[str, Any]]) -> str:
+        if not selected_expressions:
+            return ""
+        lines = [
+            f"- 当{expression['situation']}时，可以自然地用{expression['style']}这种表达习惯。"
+            for expression in selected_expressions
+        ]
+        return "【表达习惯参考】\n" + "\n".join(lines)
+
+    @staticmethod
+    def _normalize_history_line(message: LLMContextMessage) -> str:
+        content = " ".join((message.processed_plain_text or "").split()).strip()
+        if len(content) > 120:
+            content = content[:120] + "..."
+        timestamp = message.timestamp.strftime("%H:%M:%S") if isinstance(message.timestamp, datetime) else ""
+        return f"- {timestamp} {message.role}: {content}".strip()
+
+    def _build_selector_prompt(
+        self,
+        *,
+        chat_history: List[LLMContextMessage],
+        reply_message: Optional[SessionMessage],
+        reply_reason: str,
+        candidates: List[dict[str, Any]],
+    ) -> str:
+        history_lines = [
+            self._normalize_history_line(message)
+            for message in chat_history[-10:]
+            if (message.processed_plain_text or "").strip()
+        ]
+        history_block = "\n".join(history_lines) if history_lines else "- 无可用上下文"
+        candidate_lines = [
+            f"{candidate['id']}: 情景={candidate['situation']} | 风格={candidate['style']} | count={candidate['count']}"
+            for candidate in candidates
+        ]
+        target_text = (reply_message.processed_plain_text or "").strip() if reply_message is not None else ""
+
+        return (
+            "你是 Maisaka 的表达方式选择子代理。\n"
+            "你只负责根据最近聊天上下文，为这一次可见回复挑选最合适的表达方式。\n"
+            "请只从下面候选中选择 0 到 3 条最适合当前语境的表达方式。\n"
+            "优先考虑自然、贴合上下文、不生硬、不模板化。\n"
+            "如果没有明显合适的，就返回空列表。\n"
+            '严格只输出 JSON，对象格式为 {"selected_ids":[123,456]}。\n\n'
+            f"最近上下文：\n{history_block}\n\n"
+            f"目标消息：{target_text or '无'}\n"
+            f"回复理由：{reply_reason.strip() or '无'}\n\n"
+            f"候选表达方式：\n{chr(10).join(candidate_lines)}"
+        )
+
+    def _parse_selected_ids(self, raw_response: str, candidates: List[dict[str, Any]]) -> List[int]:
+        if not raw_response.strip():
+            return []
+        try:
+            parsed_result = json.loads(repair_json(raw_response))
+        except Exception:
+            logger.warning(f"表达方式选择结果解析失败: {raw_response!r}")
+            return []
+
+        raw_selected_ids = parsed_result.get("selected_ids", []) if isinstance(parsed_result, dict) else []
+        if not isinstance(raw_selected_ids, list):
+            return []
+
+        candidate_map = {
+            candidate["id"]: candidate
+            for candidate in candidates
+            if isinstance(candidate.get("id"), int)
+        }
+        selected_ids: List[int] = []
+        for candidate_id in raw_selected_ids:
+            if not isinstance(candidate_id, int):
+                continue
+            if candidate_id not in candidate_map or candidate_id in selected_ids:
+                continue
+            selected_ids.append(candidate_id)
+            if len(selected_ids) >= 3:
+                break
+        return selected_ids
+
+    def _update_last_active_time(self, selected_ids: List[int]) -> None:
+        if not selected_ids:
+            return
+        with get_db_session() as session:
+            expressions = session.exec(select(Expression).where(Expression.id.in_(selected_ids))).all()  # type: ignore[attr-defined]
+            now = datetime.now()
+            for expression in expressions:
+                expression.last_active_time = now
+                session.add(expression)
+
+    async def select_for_reply(
+        self,
+        *,
+        session_id: str,
+        chat_history: List[LLMContextMessage],
+        reply_message: Optional[SessionMessage],
+        reply_reason: str,
+        sub_agent_runner: Optional[SubAgentRunner],
+    ) -> MaisakaExpressionSelectionResult:
+        if not session_id:
+            logger.info("表达方式选择已跳过：缺少 session_id")
+            return MaisakaExpressionSelectionResult()
+        if not self._can_use_expressions(session_id):
+            logger.info(f"表达方式选择已跳过：当前会话未启用表达方式，session_id={session_id}")
+            return MaisakaExpressionSelectionResult()
+        if sub_agent_runner is None:
+            logger.info(f"表达方式选择已跳过：缺少 sub_agent_runner，session_id={session_id}")
+            return MaisakaExpressionSelectionResult()
+
+        candidates = self._load_expression_candidates(session_id)
+        if not candidates:
+            logger.info(f"表达方式选择已跳过：本地候选不足，session_id={session_id}")
+            return MaisakaExpressionSelectionResult()
+
+        logger.info(
+            f"表达方式选择开始：session_id={session_id} 候选数={len(candidates)} "
+            f"候选预览={self._format_candidate_preview(candidates)}"
+        )
+
+        selector_prompt = self._build_selector_prompt(
+            chat_history=chat_history,
+            reply_message=reply_message,
+            reply_reason=reply_reason,
+            candidates=candidates,
+        )
+        try:
+            raw_response = await sub_agent_runner(selector_prompt)
+        except Exception:
+            logger.exception("表达方式选择子代理执行失败")
+            return MaisakaExpressionSelectionResult()
+
+        logger.info(f"表达方式子代理原始结果：session_id={session_id} response={raw_response!r}")
+        selected_ids = self._parse_selected_ids(raw_response, candidates)
+        if not selected_ids:
+            logger.info(f"表达方式选择完成但未命中：session_id={session_id}")
+            return MaisakaExpressionSelectionResult()
+
+        selected_expressions = [candidate for candidate in candidates if candidate.get("id") in selected_ids]
+        self._update_last_active_time(selected_ids)
+        logger.info(
+            f"表达方式选择完成：session_id={session_id} 已选数={len(selected_ids)} "
+            f"selected_ids={selected_ids!r} 已选预览={self._format_candidate_preview(selected_expressions)}"
+        )
+        return MaisakaExpressionSelectionResult(
+            expression_habits=self._build_expression_habits_block(selected_expressions),
+            selected_expression_ids=selected_ids,
+        )
+
+
+maisaka_expression_selector = MaisakaExpressionSelector()
--- a/src/chat/replyer/maisaka_generator.py
+++ b/src/chat/replyer/maisaka_generator.py
@@ -1,15 +1,12 @@
 from dataclasses import dataclass, field
 from datetime import datetime
-from typing import Dict, List, Optional, Tuple
+from typing import Awaitable, Callable, Dict, List, Optional, Tuple

 import random
 import time

-from sqlmodel import select
-
 from src.chat.message_receive.chat_manager import BotChatSession
-from src.common.database.database import get_db_session
-from src.common.database.database_model import Expression
+from src.chat.message_receive.message import SessionMessage
 from src.common.data_models.reply_generation_data_models import (
    GenerationMetrics,
    LLMCompletionResult,
@@ -17,13 +14,12 @@ from src.common.data_models.reply_generation_data_models import (
 )
 from src.common.logger import get_logger
 from src.common.prompt_i18n import load_prompt
-from src.common.utils.utils_session import SessionUtils
 from src.config.config import global_config
 from src.core.types import ActionInfo
 from src.services.llm_service import LLMServiceClient

-from src.chat.message_receive.message import SessionMessage
 from src.maisaka.context_messages import AssistantMessage, LLMContextMessage, ReferenceMessage, SessionBackedMessage, ToolResultMessage
+from .maisaka_expression_selector import maisaka_expression_selector
 from src.maisaka.message_adapter import parse_speaker_content

 logger = get_logger("replyer")
@@ -37,15 +33,6 @@ class MaisakaReplyContext:
    selected_expression_ids: List[int] = field(default_factory=list)


-@dataclass
-class _ExpressionRecord:
-    """表达方式的轻量记录。"""
-
-    expression_id: Optional[int]
-    situation: str
-    style: str
-
-
 class MaisakaReplyGenerator:
    """生成 Maisaka 的最终可见回复。"""

@@ -238,109 +225,30 @@ class MaisakaReplyGenerator:
        reply_message: Optional[SessionMessage],
        reply_reason: str,
        stream_id: Optional[str],
+        sub_agent_runner: Optional[Callable[[str], Awaitable[str]]],
    ) -> MaisakaReplyContext:
-        """在 replyer 内部构建表达习惯和黑话解释。"""
+        """构建回复上下文：表达习惯和已选表达 ID。"""
        session_id = self._resolve_session_id(stream_id)
        if not session_id:
            logger.warning("构建 Maisaka 回复上下文失败：缺少会话标识")
            return MaisakaReplyContext()

-        expression_habits, selected_expression_ids = self._build_expression_habits(
+        if sub_agent_runner is None:
+            logger.info("表达方式选择跳过：缺少子代理执行器")
+            return MaisakaReplyContext()
+
+        selection_result = await maisaka_expression_selector.select_for_reply(
            session_id=session_id,
            chat_history=chat_history,
            reply_message=reply_message,
            reply_reason=reply_reason,
+            sub_agent_runner=sub_agent_runner,
        )
        return MaisakaReplyContext(
-            expression_habits=expression_habits,
-            selected_expression_ids=selected_expression_ids,
+            expression_habits=selection_result.expression_habits,
+            selected_expression_ids=selection_result.selected_expression_ids,
        )

-    def _build_expression_habits(
-        self,
-        session_id: str,
-        chat_history: List[LLMContextMessage],
-        reply_message: Optional[SessionMessage],
-        reply_reason: str,
-    ) -> tuple[str, List[int]]:
-        """查询并格式化适合当前会话的表达习惯。"""
-        del chat_history
-        del reply_message
-        del reply_reason
-
-        expression_records = self._load_expression_records(session_id)
-        if not expression_records:
-            return "", []
-
-        lines: List[str] = []
-        selected_ids: List[int] = []
-        for expression in expression_records:
-            if expression.expression_id is not None:
-                selected_ids.append(expression.expression_id)
-            lines.append(f"- 当{expression.situation}时，可以自然地用{expression.style}这种表达习惯。")
-
-        block = "【表达习惯参考】\n" + "\n".join(lines)
-        logger.info(
-            f"已构建 Maisaka 表达习惯: 会话标识={session_id} "
-            f"数量={len(selected_ids)} 表达编号={selected_ids!r}"
-        )
-        return block, selected_ids
-
-    def _get_related_session_ids(self, session_id: str) -> List[str]:
-        """根据表达互通组配置，解析当前会话可共享的会话 ID。"""
-        related_session_ids = {session_id}
-        expression_groups = global_config.expression.expression_groups
-
-        for expression_group in expression_groups:
-            target_items = expression_group.expression_groups
-            group_session_ids: set[str] = set()
-            contains_current_session = False
-
-            for target_item in target_items:
-                platform = target_item.platform.strip()
-                item_id = target_item.item_id.strip()
-                if not platform or not item_id:
-                    continue
-
-                rule_type = target_item.rule_type
-                target_session_id = SessionUtils.calculate_session_id(
-                    platform,
-                    group_id=item_id if rule_type == "group" else None,
-                    user_id=None if rule_type == "group" else item_id,
-                )
-                group_session_ids.add(target_session_id)
-                if target_session_id == session_id:
-                    contains_current_session = True
-
-            if contains_current_session:
-                related_session_ids.update(group_session_ids)
-
-        return list(related_session_ids)
-
-    def _load_expression_records(self, session_id: str) -> List[_ExpressionRecord]:
-        """提取表达方式静态数据，避免 detached ORM 对象。"""
-        related_session_ids = self._get_related_session_ids(session_id)
-
-        with get_db_session(auto_commit=False) as session:
-            base_query = select(Expression).where(Expression.rejected.is_(False))  # type: ignore[attr-defined]
-            scoped_query = base_query.where(
-                (Expression.session_id.in_(related_session_ids)) | (Expression.session_id.is_(None))  # type: ignore[attr-defined]
-            ).order_by(Expression.count.desc(), Expression.last_active_time.desc())  # type: ignore[attr-defined]
-
-            if global_config.expression.expression_checked_only:
-                scoped_query = scoped_query.where(Expression.checked.is_(True))  # type: ignore[attr-defined]
-
-            expressions = session.exec(scoped_query.limit(5)).all()
-
-            return [
-                _ExpressionRecord(
-                    expression_id=expression.id,
-                    situation=expression.situation,
-                    style=expression.style,
-                )
-                for expression in expressions
-            ]
-
    async def generate_reply_with_context(
        self,
        extra_info: str = "",
@@ -357,6 +265,7 @@ class MaisakaReplyGenerator:
        chat_history: Optional[List[LLMContextMessage]] = None,
        expression_habits: str = "",
        selected_expression_ids: Optional[List[int]] = None,
+        sub_agent_runner: Optional[Callable[[str], Awaitable[str]]] = None,
    ) -> Tuple[bool, ReplyGenerationResult]:
        """结合上下文生成 Maisaka 的最终可见回复。"""
        del available_actions
@@ -399,6 +308,7 @@ class MaisakaReplyGenerator:
                reply_message=reply_message,
                reply_reason=reply_reason or "",
                stream_id=stream_id,
+                sub_agent_runner=sub_agent_runner,
            )
        except Exception as exc:
            import traceback
--- a/src/chat/replyer/maisaka_generator_multi.py
+++ b/src/chat/replyer/maisaka_generator_multi.py
@@ -2,18 +2,15 @@ import random
 import time
 from dataclasses import dataclass, field
 from datetime import datetime
-from typing import Dict, List, Optional, Tuple
+from typing import Awaitable, Callable, Dict, List, Optional, Tuple

 from rich.console import Group, RenderableType
 from rich.panel import Panel
 from rich.text import Text
-from sqlmodel import select

 from src.chat.message_receive.chat_manager import BotChatSession
 from src.chat.message_receive.message import SessionMessage
 from src.cli.console import console
-from src.common.database.database import get_db_session
-from src.common.database.database_model import Expression
 from src.common.data_models.message_component_data_model import MessageSequence, TextComponent
 from src.common.data_models.reply_generation_data_models import (
    GenerationMetrics,
@@ -22,7 +19,6 @@ from src.common.data_models.reply_generation_data_models import (
 )
 from src.common.logger import get_logger
 from src.common.prompt_i18n import load_prompt
-from src.common.utils.utils_session import SessionUtils
 from src.config.config import global_config
 from src.core.types import ActionInfo
 from src.llm_models.payload_content.message import ImageMessagePart, Message, MessageBuilder, RoleType, TextMessagePart
@@ -35,6 +31,7 @@ from src.maisaka.context_messages import (
    SessionBackedMessage,
    ToolResultMessage,
 )
+from .maisaka_expression_selector import maisaka_expression_selector
 from src.maisaka.message_adapter import clone_message_sequence, parse_speaker_content
 from src.maisaka.prompt_cli_renderer import PromptCLIVisualizer

@@ -49,17 +46,8 @@ class MaisakaReplyContext:
    selected_expression_ids: List[int] = field(default_factory=list)


-@dataclass
-class _ExpressionRecord:
-    """表达方式的轻量记录。"""
-
-    expression_id: Optional[int]
-    situation: str
-    style: str
-
-
 class MaisakaReplyGenerator:
-    """生成 Maisaka 的最终可见回复。"""
+    """生成 Maisaka 的最终可见回复（多模态管线）。"""

    def __init__(
        self,
@@ -75,7 +63,7 @@ class MaisakaReplyGenerator:
        self._personality_prompt = self._build_personality_prompt()

    def _build_personality_prompt(self) -> str:
-        """构建 replyer 使用的人设描述。"""
+        """构建 replyer 使用的人设提示。"""
        try:
            bot_name = global_config.bot.nickname
            alias_names = global_config.bot.alias_names
@@ -117,7 +105,6 @@ class MaisakaReplyGenerator:

    @staticmethod
    def _split_user_message_segments(raw_content: str) -> List[tuple[Optional[str], str]]:
-        """按说话人拆分用户消息。"""
        segments: List[tuple[Optional[str], str]] = []
        current_speaker: Optional[str] = None
        current_lines: List[str] = []
@@ -139,7 +126,6 @@ class MaisakaReplyGenerator:
        return segments

    def _build_target_message_block(self, reply_message: Optional[SessionMessage]) -> str:
-        """构建当前需要回复的目标消息摘要。"""
        if reply_message is None:
            return ""

@@ -155,7 +141,7 @@ class MaisakaReplyGenerator:
            f"- 目标消息ID：{target_message_id}\n"
            f"- 发送者：{sender_name}\n"
            f"- 消息内容：{target_content}\n"
-            "- 你这次要回复的就是这条目标消息，请结合整段上下文理解，但不要误把其他历史消息当成当前回复对象。"
+            "- 你这次要回复的就是这条目标消息，请结合整段上下文理解，但不要把其他历史消息当成当前回复对象。"
        )

    def _build_system_prompt(
@@ -164,7 +150,6 @@ class MaisakaReplyGenerator:
        reply_reason: str,
        expression_habits: str = "",
    ) -> str:
-        """构建 Maisaka replyer 使用的系统提示词。"""
        current_time = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
        target_message_block = self._build_target_message_block(reply_message)

@@ -179,27 +164,25 @@ class MaisakaReplyGenerator:
        except Exception:
            system_prompt = "你是一个友好的 AI 助手，请根据聊天记录自然回复。"

-        extra_sections: List[str] = []
+        sections: List[str] = []
        if expression_habits.strip():
-            extra_sections.append(expression_habits.strip())
+            sections.append(expression_habits.strip())
        if target_message_block:
-            extra_sections.append(target_message_block)
+            sections.append(target_message_block)
        if reply_reason.strip():
-            extra_sections.append(f"【回复信息参考】\n{reply_reason}")
-        if not extra_sections:
+            sections.append(f"【回复信息参考】\n{reply_reason}")
+        if not sections:
            return system_prompt
-        return f"{system_prompt}\n\n" + "\n\n".join(extra_sections)
+        return f"{system_prompt}\n\n" + "\n\n".join(sections)

    def _build_reply_instruction(self) -> str:
-        """构建追加在上下文末尾的回复指令。"""
-        return "请基于以上逐条对话消息，自然地继续回复。直接输出你要说的话，不要额外解释。"
+        return "请基于以上上下文，自然地继续回复。直接输出你要说的话，不需要额外解释。"

    def _build_multimodal_user_message(
        self,
        message: SessionBackedMessage,
        default_user_name: str,
    ) -> Optional[Message]:
-        """构建保留图片等多模态片段的用户消息。"""
        speaker_name, _ = parse_speaker_content(message.processed_plain_text.strip())
        visible_speaker = speaker_name or default_user_name

@@ -223,7 +206,6 @@ class MaisakaReplyGenerator:
        return multimodal_message.to_llm_message()

    def _build_history_messages(self, chat_history: List[LLMContextMessage]) -> List[Message]:
-        """将 replyer 上下文拆成多条 LLM 消息。"""
        bot_nickname = global_config.bot.nickname.strip() or "Bot"
        default_user_name = global_config.maisaka.cli_user_name.strip() or "User"
        messages: List[Message] = []
@@ -277,7 +259,6 @@ class MaisakaReplyGenerator:
        reply_reason: str,
        expression_habits: str = "",
    ) -> List[Message]:
-        """构建发给大模型的消息列表。"""
        messages: List[Message] = []
        system_prompt = self._build_system_prompt(
            reply_message=reply_message,
@@ -293,7 +274,6 @@ class MaisakaReplyGenerator:

    @staticmethod
    def _build_request_prompt_preview(messages: List[Message]) -> str:
-        """将消息列表转为便于调试的文本预览。"""
        preview_lines: List[str] = []
        for message in messages:
            role_name = message.role.value.capitalize()
@@ -308,7 +288,6 @@ class MaisakaReplyGenerator:
        return "\n\n".join(preview_lines)

    def _resolve_session_id(self, stream_id: Optional[str]) -> str:
-        """解析当前回复使用的会话 ID。"""
        if stream_id:
            return stream_id
        if self.chat_stream is not None:
@@ -321,109 +300,29 @@ class MaisakaReplyGenerator:
        reply_message: Optional[SessionMessage],
        reply_reason: str,
        stream_id: Optional[str],
+        sub_agent_runner: Optional[Callable[[str], Awaitable[str]]],
    ) -> MaisakaReplyContext:
-        """在 replyer 内部构建表达习惯和黑话解释。"""
        session_id = self._resolve_session_id(stream_id)
        if not session_id:
            logger.warning("构建 Maisaka 回复上下文失败：缺少会话标识")
            return MaisakaReplyContext()

-        expression_habits, selected_expression_ids = self._build_expression_habits(
+        if sub_agent_runner is None:
+            logger.info("表达方式选择跳过：缺少子代理执行器")
+            return MaisakaReplyContext()
+
+        selection_result = await maisaka_expression_selector.select_for_reply(
            session_id=session_id,
            chat_history=chat_history,
            reply_message=reply_message,
            reply_reason=reply_reason,
+            sub_agent_runner=sub_agent_runner,
        )
        return MaisakaReplyContext(
-            expression_habits=expression_habits,
-            selected_expression_ids=selected_expression_ids,
+            expression_habits=selection_result.expression_habits,
+            selected_expression_ids=selection_result.selected_expression_ids,
        )

-    def _build_expression_habits(
-        self,
-        session_id: str,
-        chat_history: List[LLMContextMessage],
-        reply_message: Optional[SessionMessage],
-        reply_reason: str,
-    ) -> tuple[str, List[int]]:
-        """查询并格式化适合当前会话的表达习惯。"""
-        del chat_history
-        del reply_message
-        del reply_reason
-
-        expression_records = self._load_expression_records(session_id)
-        if not expression_records:
-            return "", []
-
-        lines: List[str] = []
-        selected_ids: List[int] = []
-        for expression in expression_records:
-            if expression.expression_id is not None:
-                selected_ids.append(expression.expression_id)
-            lines.append(f"- 当{expression.situation}时，可以自然地用{expression.style}这种表达习惯。")
-
-        block = "【表达习惯参考】\n" + "\n".join(lines)
-        logger.info(
-            f"已构建 Maisaka 表达习惯: 会话标识={session_id} "
-            f"数量={len(selected_ids)} 表达编号={selected_ids!r}"
-        )
-        return block, selected_ids
-
-    def _get_related_session_ids(self, session_id: str) -> List[str]:
-        """根据表达互通组配置，解析当前会话可共享的会话 ID。"""
-        related_session_ids = {session_id}
-        expression_groups = global_config.expression.expression_groups
-
-        for expression_group in expression_groups:
-            target_items = expression_group.expression_groups
-            group_session_ids: set[str] = set()
-            contains_current_session = False
-
-            for target_item in target_items:
-                platform = target_item.platform.strip()
-                item_id = target_item.item_id.strip()
-                if not platform or not item_id:
-                    continue
-
-                rule_type = target_item.rule_type
-                target_session_id = SessionUtils.calculate_session_id(
-                    platform,
-                    group_id=item_id if rule_type == "group" else None,
-                    user_id=None if rule_type == "group" else item_id,
-                )
-                group_session_ids.add(target_session_id)
-                if target_session_id == session_id:
-                    contains_current_session = True
-
-            if contains_current_session:
-                related_session_ids.update(group_session_ids)
-
-        return list(related_session_ids)
-
-    def _load_expression_records(self, session_id: str) -> List[_ExpressionRecord]:
-        """提取表达方式静态数据，避免 detached ORM 对象。"""
-        related_session_ids = self._get_related_session_ids(session_id)
-
-        with get_db_session(auto_commit=False) as session:
-            base_query = select(Expression).where(Expression.rejected.is_(False))  # type: ignore[attr-defined]
-            scoped_query = base_query.where(
-                (Expression.session_id.in_(related_session_ids)) | (Expression.session_id.is_(None))  # type: ignore[attr-defined]
-            ).order_by(Expression.count.desc(), Expression.last_active_time.desc())  # type: ignore[attr-defined]
-
-            if global_config.expression.expression_checked_only:
-                scoped_query = scoped_query.where(Expression.checked.is_(True))  # type: ignore[attr-defined]
-
-            expressions = session.exec(scoped_query.limit(5)).all()
-
-            return [
-                _ExpressionRecord(
-                    expression_id=expression.id,
-                    situation=expression.situation,
-                    style=expression.style,
-                )
-                for expression in expressions
-            ]
-
    async def generate_reply_with_context(
        self,
        extra_info: str = "",
@@ -440,8 +339,8 @@ class MaisakaReplyGenerator:
        chat_history: Optional[List[LLMContextMessage]] = None,
        expression_habits: str = "",
        selected_expression_ids: Optional[List[int]] = None,
+        sub_agent_runner: Optional[Callable[[str], Awaitable[str]]] = None,
    ) -> Tuple[bool, ReplyGenerationResult]:
-        """结合上下文生成 Maisaka 的最终可见回复。"""
        del available_actions
        del chosen_actions
        del extra_info
@@ -457,9 +356,8 @@ class MaisakaReplyGenerator:
            return False, result

        logger.info(
-            f"Maisaka 回复器开始生成: 会话流标识={stream_id} 回复原因={reply_reason!r} "
-            f"历史消息数={len(chat_history)} 目标消息编号="
-            f"{reply_message.message_id if reply_message else None}"
+            f"Maisaka 回复器开始生成: 流={stream_id} 原因={reply_reason!r} "
+            f"历史条数={len(chat_history)} 目标ID={reply_message.message_id if reply_message else None}"
        )

        filtered_history = [
@@ -468,11 +366,8 @@ class MaisakaReplyGenerator:
            if not isinstance(message, (ReferenceMessage, ToolResultMessage))
        ]

-        logger.debug(f"Maisaka 回复器过滤后历史消息数={len(filtered_history)}")
-
-        # Validate that express_model is properly initialized
        if self.express_model is None:
-            logger.error("Maisaka 回复器的回复模型未初始化")
+            logger.error("回复模型未初始化")
            result.error_message = "回复模型尚未初始化"
            return False, result

@@ -482,10 +377,11 @@ class MaisakaReplyGenerator:
                reply_message=reply_message,
                reply_reason=reply_reason or "",
                stream_id=stream_id,
+                sub_agent_runner=sub_agent_runner,
            )
        except Exception as exc:
            import traceback
-            logger.error(f"Maisaka 回复器构建回复上下文失败: {exc}\n{traceback.format_exc()}")
+            logger.error(f"构建回复上下文失败: {exc}\n{traceback.format_exc()}")
            result.error_message = f"构建回复上下文失败: {exc}"
            return False, result

@@ -497,8 +393,7 @@ class MaisakaReplyGenerator:
        )

        logger.info(
-            f"Maisaka 回复上下文构建完成: 会话流标识={stream_id} "
-            f"已选表达编号={result.selected_expression_ids!r}"
+            f"回复上下文完成: 流={stream_id} 已选表达={result.selected_expression_ids!r}"
        )

        try:
@@ -510,7 +405,7 @@ class MaisakaReplyGenerator:
            )
        except Exception as exc:
            import traceback
-            logger.error(f"Maisaka 回复器构建提示词失败: {exc}\n{traceback.format_exc()}")
+            logger.error(f"构建提示词失败: {exc}\n{traceback.format_exc()}")
            result.error_message = f"构建提示词失败: {exc}"
            return False, result

@@ -528,13 +423,15 @@ class MaisakaReplyGenerator:
                category="replyer",
                chat_id=preview_chat_id,
                request_kind="replyer",
-                subtitle=f"会话流标识：{preview_chat_id}",
+                subtitle=f"流ID: {preview_chat_id}",
                folded=global_config.debug.fold_maisaka_thinking,
            )

        started_at = time.perf_counter()
        try:
-            generation_result = await self.express_model.generate_response_with_messages(message_factory=message_factory)
+            generation_result = await self.express_model.generate_response_with_messages(
+                message_factory=message_factory
+            )
        except Exception as exc:
            logger.exception("Maisaka 回复器调用失败")
            result.error_message = str(exc)
@@ -565,17 +462,15 @@ class MaisakaReplyGenerator:
            return False, result

        logger.info(
-            f"Maisaka 回复器生成成功: 回复文本={response_text!r} "
-            f"总耗时毫秒={result.metrics.overall_ms} "
-            f"已选表达编号={result.selected_expression_ids!r}"
+            f"Maisaka 回复器生成成功: 文本={response_text!r} 总耗时ms={result.metrics.overall_ms} 已选表达={result.selected_expression_ids!r}"
        )
        if global_config.debug.show_replyer_prompt or global_config.debug.show_replyer_reasoning:
            summary_lines = [
-                f"会话流标识: {preview_chat_id or 'unknown'}",
-                f"总耗时: {result.metrics.overall_ms} ms",
+                f"流ID: {preview_chat_id or 'unknown'}",
+                f"耗时: {result.metrics.overall_ms} ms",
            ]
            if result.selected_expression_ids:
-                summary_lines.append(f"表达习惯编号: {result.selected_expression_ids!r}")
+                summary_lines.append(f"表达编号: {result.selected_expression_ids!r}")

            renderables: List[RenderableType] = [Text("\n".join(summary_lines))]
            if replyer_prompt_section is not None:
@@ -584,7 +479,7 @@ class MaisakaReplyGenerator:
                renderables.append(
                    Panel(
                        Text(result.completion.reasoning_text),
-                        title="回复器思考",
+                        title="思考内容",
                        border_style="magenta",
                        padding=(0, 1),
                    )
@@ -600,7 +495,7 @@ class MaisakaReplyGenerator:
            console.print(
                Panel(
                    Group(*renderables),
-                    title="MaiSaka 回复器结果",
+                    title="MaiSaka 回复器",
                    border_style="bright_yellow",
                    padding=(0, 1),
                )