移除不再使用的聊天总结，移除路径显示配置项，修复回复器错判的一个问题

2026-04-13 18:57:50 +08:00
parent 412166ed7e
commit 01ba4f55c2
17 changed files with 22 additions and 4395 deletions
--- a/pytests/A_memorix_test/test_chat_history_summarizer_memory_import.py
+++ b/pytests/A_memorix_test/test_chat_history_summarizer_memory_import.py
@@ -1,148 +0,0 @@
-from types import SimpleNamespace
-
-import pytest
-
-from src.memory_system import chat_history_summarizer as summarizer_module
-
-
-def _build_summarizer() -> summarizer_module.ChatHistorySummarizer:
-    summarizer = summarizer_module.ChatHistorySummarizer.__new__(summarizer_module.ChatHistorySummarizer)
-    summarizer.session_id = "session-1"
-    summarizer.log_prefix = "[session-1]"
-    return summarizer
-
-
-@pytest.mark.asyncio
-async def test_import_to_long_term_memory_uses_summary_payload(monkeypatch):
-    calls = []
-    summarizer = _build_summarizer()
-
-    async def fake_ingest_summary(**kwargs):
-        calls.append(kwargs)
-        return SimpleNamespace(success=True, detail="", stored_ids=["p1"])
-
-    monkeypatch.setattr(
-        summarizer_module,
-        "_chat_manager",
-        SimpleNamespace(get_session_by_session_id=lambda session_id: SimpleNamespace(user_id="user-1", group_id="")),
-    )
-    monkeypatch.setattr(summarizer_module, "global_config", SimpleNamespace(memory=SimpleNamespace(chat_history_topic_check_message_threshold=8)))
-    monkeypatch.setattr("src.services.memory_service.memory_service.ingest_summary", fake_ingest_summary)
-
-    await summarizer._import_to_long_term_memory(
-        record_id=1,
-        theme="旅行计划",
-        summary="我们讨论了春游安排",
-        participants=["Alice", "Bob"],
-        start_time=1.0,
-        end_time=2.0,
-        original_text="long text",
-    )
-
-    assert len(calls) == 1
-    payload = calls[0]
-    assert payload["external_id"] == "chat_history:1"
-    assert payload["chat_id"] == "session-1"
-    assert payload["participants"] == ["Alice", "Bob"]
-    assert payload["respect_filter"] is True
-    assert payload["user_id"] == "user-1"
-    assert payload["group_id"] == ""
-    assert "主题：旅行计划" in payload["text"]
-    assert "概括：我们讨论了春游安排" in payload["text"]
-
-
-@pytest.mark.asyncio
-async def test_import_to_long_term_memory_falls_back_when_content_empty(monkeypatch):
-    summarizer = _build_summarizer()
-    fallback_calls = []
-
-    async def fake_fallback(**kwargs):
-        fallback_calls.append(kwargs)
-
-    summarizer._fallback_import_to_long_term_memory = fake_fallback
-    monkeypatch.setattr(
-        summarizer_module,
-        "_chat_manager",
-        SimpleNamespace(get_session_by_session_id=lambda session_id: SimpleNamespace(user_id="user-1", group_id="")),
-    )
-
-    await summarizer._import_to_long_term_memory(
-        record_id=2,
-        theme="",
-        summary="",
-        participants=[],
-        start_time=10.0,
-        end_time=20.0,
-        original_text="raw chat",
-    )
-
-    assert len(fallback_calls) == 1
-    assert fallback_calls[0]["record_id"] == 2
-    assert fallback_calls[0]["original_text"] == "raw chat"
-
-
-@pytest.mark.asyncio
-async def test_import_to_long_term_memory_falls_back_when_ingest_fails(monkeypatch):
-    summarizer = _build_summarizer()
-    fallback_calls = []
-
-    async def fake_ingest_summary(**kwargs):
-        return SimpleNamespace(success=False, detail="boom", stored_ids=[])
-
-    async def fake_fallback(**kwargs):
-        fallback_calls.append(kwargs)
-
-    summarizer._fallback_import_to_long_term_memory = fake_fallback
-    monkeypatch.setattr(
-        summarizer_module,
-        "_chat_manager",
-        SimpleNamespace(get_session_by_session_id=lambda session_id: SimpleNamespace(user_id="user-1", group_id="group-1")),
-    )
-    monkeypatch.setattr("src.services.memory_service.memory_service.ingest_summary", fake_ingest_summary)
-
-    await summarizer._import_to_long_term_memory(
-        record_id=3,
-        theme="电影",
-        summary="聊了电影推荐",
-        participants=["Alice"],
-        start_time=3.0,
-        end_time=4.0,
-        original_text="raw",
-    )
-
-    assert len(fallback_calls) == 1
-    assert fallback_calls[0]["theme"] == "电影"
-
-
-@pytest.mark.asyncio
-async def test_fallback_import_to_long_term_memory_sets_generate_from_chat(monkeypatch):
-    calls = []
-    summarizer = _build_summarizer()
-
-    async def fake_ingest_summary(**kwargs):
-        calls.append(kwargs)
-        return SimpleNamespace(success=True, detail="chat_filtered", stored_ids=[])
-
-    monkeypatch.setattr(
-        summarizer_module,
-        "_chat_manager",
-        SimpleNamespace(get_session_by_session_id=lambda session_id: SimpleNamespace(user_id="user-2", group_id="group-2")),
-    )
-    monkeypatch.setattr(summarizer_module, "global_config", SimpleNamespace(memory=SimpleNamespace(chat_history_topic_check_message_threshold=12)))
-    monkeypatch.setattr("src.services.memory_service.memory_service.ingest_summary", fake_ingest_summary)
-
-    await summarizer._fallback_import_to_long_term_memory(
-        record_id=4,
-        theme="工作",
-        participants=["Alice"],
-        start_time=5.0,
-        end_time=6.0,
-        original_text="a" * 128,
-    )
-
-    assert len(calls) == 1
-    metadata = calls[0]["metadata"]
-    assert metadata["generate_from_chat"] is True
-    assert metadata["context_length"] == 12
-    assert calls[0]["respect_filter"] is True
-
--- a/pytests/A_memorix_test/test_group_chat_stream_memory_benchmark.py
+++ b/pytests/A_memorix_test/test_group_chat_stream_memory_benchmark.py
--- a/pytests/A_memorix_test/test_long_novel_memory_benchmark.py
+++ b/pytests/A_memorix_test/test_long_novel_memory_benchmark.py
@@ -1,687 +0,0 @@
-from __future__ import annotations
-
-import asyncio
-import inspect
-import json
-from datetime import datetime
-from pathlib import Path
-from types import SimpleNamespace
-from typing import Any, Dict, List
-
-import numpy as np
-import pytest
-import pytest_asyncio
-
-from A_memorix.core.runtime import sdk_memory_kernel as kernel_module
-from A_memorix.core.runtime.sdk_memory_kernel import KernelSearchRequest, SDKMemoryKernel
-from src.chat.brain_chat.PFC import pfc_KnowledgeFetcher as knowledge_module
-from src.memory_system import chat_history_summarizer as summarizer_module
-from src.memory_system.retrieval_tools.query_long_term_memory import query_long_term_memory
-from src.person_info import person_info as person_info_module
-from src.services import memory_service as memory_service_module
-from src.services.memory_service import MemorySearchResult, memory_service
-
-
-DATA_FILE = Path(__file__).parent / "data" / "benchmarks" / "long_novel_memory_benchmark.json"
-REPORT_FILE = Path(__file__).parent / "data" / "benchmarks" / "results" / "long_novel_memory_benchmark_report.json"
-
-
-def _load_benchmark_fixture() -> Dict[str, Any]:
-    return json.loads(DATA_FILE.read_text(encoding="utf-8"))
-
-
-class _FakeEmbeddingAdapter:
-    def __init__(self, dimension: int = 32) -> None:
-        self.dimension = dimension
-
-    async def _detect_dimension(self) -> int:
-        return self.dimension
-
-    async def encode(self, texts, dimensions=None):
-        dim = int(dimensions or self.dimension)
-        if isinstance(texts, str):
-            sequence = [texts]
-            single = True
-        else:
-            sequence = list(texts)
-            single = False
-
-        rows = []
-        for text in sequence:
-            vec = np.zeros(dim, dtype=np.float32)
-            for ch in str(text or ""):
-                code = ord(ch)
-                vec[code % dim] += 1.0
-                vec[(code * 7) % dim] += 0.5
-            if not vec.any():
-                vec[0] = 1.0
-            norm = np.linalg.norm(vec)
-            if norm > 0:
-                vec = vec / norm
-            rows.append(vec)
-        payload = np.vstack(rows)
-        return payload[0] if single else payload
-
-
-class _KnownPerson:
-    def __init__(self, person_id: str, registry: Dict[str, str], reverse_registry: Dict[str, str]) -> None:
-        self.person_id = person_id
-        self.is_known = person_id in reverse_registry
-        self.person_name = reverse_registry.get(person_id, "")
-        self._registry = registry
-
-
-class _KernelBackedRuntimeManager:
-    def __init__(self, kernel: SDKMemoryKernel) -> None:
-        self.kernel = kernel
-
-    async def invoke(self, component_name: str, args: Dict[str, Any] | None, *, timeout_ms: int = 30000):
-        del timeout_ms
-        payload = args or {}
-        if component_name == "search_memory":
-            return await self.kernel.search_memory(
-                KernelSearchRequest(
-                    query=str(payload.get("query", "") or ""),
-                    limit=int(payload.get("limit", 5) or 5),
-                    mode=str(payload.get("mode", "hybrid") or "hybrid"),
-                    chat_id=str(payload.get("chat_id", "") or ""),
-                    person_id=str(payload.get("person_id", "") or ""),
-                    time_start=payload.get("time_start"),
-                    time_end=payload.get("time_end"),
-                    respect_filter=bool(payload.get("respect_filter", True)),
-                    user_id=str(payload.get("user_id", "") or ""),
-                    group_id=str(payload.get("group_id", "") or ""),
-                )
-            )
-
-        handler = getattr(self.kernel, component_name)
-        result = handler(**payload)
-        return await result if inspect.isawaitable(result) else result
-
-
-async def _wait_for_import_task(task_id: str, *, max_rounds: int = 200, sleep_seconds: float = 0.05) -> Dict[str, Any]:
-    for _ in range(max_rounds):
-        detail = await memory_service.import_admin(action="get", task_id=task_id, include_chunks=True)
-        task = detail.get("task") or {}
-        status = str(task.get("status", "") or "")
-        if status in {"completed", "completed_with_errors", "failed", "cancelled"}:
-            return detail
-        await asyncio.sleep(max(0.01, float(sleep_seconds)))
-    raise AssertionError(f"导入任务在等待窗口内未结束: {task_id}")
-
-
-def _join_hit_content(search_result: MemorySearchResult) -> str:
-    return "\n".join(hit.content for hit in search_result.hits)
-
-
-def _keyword_hits(text: str, keywords: List[str]) -> int:
-    haystack = str(text or "")
-    return sum(1 for keyword in keywords if keyword in haystack)
-
-
-def _keyword_recall(text: str, keywords: List[str]) -> float:
-    if not keywords:
-        return 1.0
-    return _keyword_hits(text, keywords) / float(len(keywords))
-
-
-def _hit_blob(hit) -> str:
-    meta = hit.metadata if isinstance(hit.metadata, dict) else {}
-    return "\n".join(
-        [
-            str(hit.content or ""),
-            str(hit.title or ""),
-            str(hit.source or ""),
-            json.dumps(meta, ensure_ascii=False),
-        ]
-    )
-
-
-def _first_relevant_rank(search_result: MemorySearchResult, keywords: List[str], minimum_keyword_hits: int) -> int:
-    for index, hit in enumerate(search_result.hits[:5], start=1):
-        if _keyword_hits(_hit_blob(hit), keywords) >= max(1, int(minimum_keyword_hits or len(keywords))):
-            return index
-    return 0
-
-
-def _episode_blob_from_items(items: List[Dict[str, Any]]) -> str:
-    return "\n".join(
-        (
-            f"{item.get('title', '')}\n"
-            f"{item.get('summary', '')}\n"
-            f"{json.dumps(item.get('keywords', []), ensure_ascii=False)}\n"
-            f"{json.dumps(item.get('participants', []), ensure_ascii=False)}"
-        )
-        for item in items
-    )
-
-
-def _episode_blob_from_hits(search_result: MemorySearchResult) -> str:
-    chunks = []
-    for hit in search_result.hits:
-        meta = hit.metadata if isinstance(hit.metadata, dict) else {}
-        chunks.append(
-            "\n".join(
-                [
-                    str(hit.title or ""),
-                    str(hit.content or ""),
-                    json.dumps(meta.get("keywords", []) or [], ensure_ascii=False),
-                    json.dumps(meta.get("participants", []) or [], ensure_ascii=False),
-                ]
-            )
-        )
-    return "\n".join(chunks)
-
-
-async def _evaluate_episode_generation(*, session_id: str, episode_cases: List[Dict[str, Any]]) -> Dict[str, Any]:
-    episode_source = f"chat_summary:{session_id}"
-    payload = await memory_service.episode_admin(
-        action="query",
-        source=episode_source,
-        limit=20,
-    )
-    items = payload.get("items") or []
-    blob = _episode_blob_from_items(items)
-    reports: List[Dict[str, Any]] = []
-    success_rate = 0.0
-    keyword_recall = 0.0
-
-    for case in episode_cases:
-        recall = _keyword_recall(blob, case["expected_keywords"])
-        success = bool(items) and recall >= float(case.get("minimum_keyword_recall", 1.0))
-        success_rate += 1.0 if success else 0.0
-        keyword_recall += recall
-        reports.append(
-            {
-                "query": case["query"],
-                "success": success,
-                "keyword_recall": recall,
-                "episode_count": len(items),
-                "top_episode": items[0] if items else None,
-            }
-        )
-
-    total = max(1, len(episode_cases))
-    return {
-        "success_rate": round(success_rate / total, 4),
-        "keyword_recall": round(keyword_recall / total, 4),
-        "episode_count": len(items),
-        "reports": reports,
-    }
-
-
-async def _evaluate_episode_admin_query(*, session_id: str, episode_cases: List[Dict[str, Any]]) -> Dict[str, Any]:
-    reports: List[Dict[str, Any]] = []
-    success_rate = 0.0
-    keyword_recall = 0.0
-    episode_source = f"chat_summary:{session_id}"
-
-    for case in episode_cases:
-        payload = await memory_service.episode_admin(
-            action="query",
-            source=episode_source,
-            query=case["query"],
-            limit=5,
-        )
-        items = payload.get("items") or []
-        blob = "\n".join(
-            f"{item.get('title', '')}\n{item.get('summary', '')}\n{json.dumps(item.get('keywords', []), ensure_ascii=False)}"
-            for item in items
-        )
-        recall = _keyword_recall(blob, case["expected_keywords"])
-        success = bool(items) and recall >= float(case.get("minimum_keyword_recall", 1.0))
-        success_rate += 1.0 if success else 0.0
-        keyword_recall += recall
-        reports.append(
-            {
-                "query": case["query"],
-                "success": success,
-                "keyword_recall": recall,
-                "episode_count": len(items),
-                "top_episode": items[0] if items else None,
-            }
-        )
-
-    total = max(1, len(episode_cases))
-    return {
-        "success_rate": round(success_rate / total, 4),
-        "keyword_recall": round(keyword_recall / total, 4),
-        "reports": reports,
-    }
-
-
-async def _evaluate_episode_search_mode(*, session_id: str, episode_cases: List[Dict[str, Any]]) -> Dict[str, Any]:
-    reports: List[Dict[str, Any]] = []
-    success_rate = 0.0
-    keyword_recall = 0.0
-
-    for case in episode_cases:
-        result = await memory_service.search(
-            case["query"],
-            mode="episode",
-            chat_id=session_id,
-            respect_filter=False,
-            limit=5,
-        )
-        blob = _episode_blob_from_hits(result)
-        recall = _keyword_recall(blob, case["expected_keywords"])
-        success = bool(result.hits) and recall >= float(case.get("minimum_keyword_recall", 1.0))
-        success_rate += 1.0 if success else 0.0
-        keyword_recall += recall
-        reports.append(
-            {
-                "query": case["query"],
-                "success": success,
-                "keyword_recall": recall,
-                "episode_count": len(result.hits),
-                "top_episode": result.hits[0].to_dict() if result.hits else None,
-            }
-        )
-
-    total = max(1, len(episode_cases))
-    return {
-        "success_rate": round(success_rate / total, 4),
-        "keyword_recall": round(keyword_recall / total, 4),
-        "reports": reports,
-    }
-
-
-async def _evaluate_tool_modes(*, session_id: str, dataset: Dict[str, Any]) -> Dict[str, Any]:
-    search_case = dataset["search_cases"][0]
-    episode_case = dataset["episode_cases"][0]
-    aggregate_case = dataset["knowledge_fetcher_cases"][0]
-    first_record = (dataset.get("chat_history_records") or [{}])[0]
-    reference_ts = first_record.get("end_time") or first_record.get("start_time") or 0
-    if reference_ts:
-        time_expression = datetime.fromtimestamp(float(reference_ts)).strftime("%Y/%m/%d")
-    else:
-        time_expression = "最近7天"
-    tool_cases = [
-        {
-            "name": "search",
-            "kwargs": {
-                "query": "蓝漆铁盒 北塔木梯",
-                "mode": "search",
-                "chat_id": session_id,
-                "limit": 5,
-            },
-            "expected_keywords": ["蓝漆铁盒", "北塔木梯", "海潮图"],
-            "minimum_keyword_recall": 0.67,
-        },
-        {
-            "name": "time",
-            "kwargs": {
-                "query": "蓝漆铁盒 北塔",
-                "mode": "time",
-                "chat_id": session_id,
-                "limit": 5,
-                "time_expression": time_expression,
-            },
-            "expected_keywords": ["蓝漆铁盒", "北塔木梯"],
-            "minimum_keyword_recall": 0.67,
-        },
-        {
-            "name": "episode",
-            "kwargs": {
-                "query": episode_case["query"],
-                "mode": "episode",
-                "chat_id": session_id,
-                "limit": 5,
-            },
-            "expected_keywords": episode_case["expected_keywords"],
-            "minimum_keyword_recall": 0.67,
-        },
-        {
-            "name": "aggregate",
-            "kwargs": {
-                "query": aggregate_case["query"],
-                "mode": "aggregate",
-                "chat_id": session_id,
-                "limit": 5,
-            },
-            "expected_keywords": aggregate_case["expected_keywords"],
-            "minimum_keyword_recall": 0.67,
-        },
-    ]
-    reports: List[Dict[str, Any]] = []
-    success_rate = 0.0
-    keyword_recall = 0.0
-
-    for case in tool_cases:
-        text = await query_long_term_memory(**case["kwargs"])
-        recall = _keyword_recall(text, case["expected_keywords"])
-        success = (
-            "失败" not in text
-            and "无法解析" not in text
-            and "未找到" not in text
-            and recall >= float(case["minimum_keyword_recall"])
-        )
-        success_rate += 1.0 if success else 0.0
-        keyword_recall += recall
-        reports.append(
-            {
-                "name": case["name"],
-                "success": success,
-                "keyword_recall": recall,
-                "preview": text[:320],
-            }
-        )
-
-    total = max(1, len(tool_cases))
-    return {
-        "success_rate": round(success_rate / total, 4),
-        "keyword_recall": round(keyword_recall / total, 4),
-        "reports": reports,
-    }
-
-
-@pytest_asyncio.fixture
-async def benchmark_env(monkeypatch, tmp_path):
-    dataset = _load_benchmark_fixture()
-    session_cfg = dataset["session"]
-    session = SimpleNamespace(
-        session_id=session_cfg["session_id"],
-        platform=session_cfg["platform"],
-        user_id=session_cfg["user_id"],
-        group_id=session_cfg["group_id"],
-    )
-    fake_chat_manager = SimpleNamespace(
-        get_session_by_session_id=lambda session_id: session if session_id == session.session_id else None,
-        get_session_name=lambda session_id: session_cfg["display_name"] if session_id == session.session_id else session_id,
-    )
-
-    registry = {item["person_name"]: item["person_id"] for item in dataset["person_writebacks"]}
-    reverse_registry = {value: key for key, value in registry.items()}
-
-    monkeypatch.setattr(kernel_module, "create_embedding_api_adapter", lambda **kwargs: _FakeEmbeddingAdapter())
-
-    async def fake_self_check(**kwargs):
-        return {"ok": True, "message": "ok", "encoded_dimension": 32}
-
-    monkeypatch.setattr(kernel_module, "run_embedding_runtime_self_check", fake_self_check)
-    monkeypatch.setattr(summarizer_module, "_chat_manager", fake_chat_manager)
-    monkeypatch.setattr(knowledge_module, "_chat_manager", fake_chat_manager)
-    monkeypatch.setattr(person_info_module, "_chat_manager", fake_chat_manager)
-    monkeypatch.setattr(person_info_module, "get_person_id_by_person_name", lambda person_name: registry.get(str(person_name or "").strip(), ""))
-    monkeypatch.setattr(
-        person_info_module,
-        "Person",
-        lambda person_id: _KnownPerson(person_id=str(person_id or ""), registry=registry, reverse_registry=reverse_registry),
-    )
-
-    data_dir = (tmp_path / "a_memorix_benchmark_data").resolve()
-    kernel = SDKMemoryKernel(
-        plugin_root=tmp_path / "plugin_root",
-        config={
-            "storage": {"data_dir": str(data_dir)},
-            "advanced": {"enable_auto_save": False},
-            "memory": {"base_decay_interval_hours": 24},
-            "person_profile": {"refresh_interval_minutes": 5},
-        },
-    )
-    manager = _KernelBackedRuntimeManager(kernel)
-    monkeypatch.setattr(memory_service_module, "a_memorix_host_service", manager)
-
-    await kernel.initialize()
-    try:
-        yield {
-            "dataset": dataset,
-            "kernel": kernel,
-            "session": session,
-            "person_registry": registry,
-        }
-    finally:
-        await kernel.shutdown()
-
-
-@pytest.mark.asyncio
-async def test_long_novel_memory_benchmark(benchmark_env):
-    dataset = benchmark_env["dataset"]
-    session_id = benchmark_env["session"].session_id
-
-    created = await memory_service.import_admin(
-        action="create_paste",
-        name="long_novel_memory_benchmark.json",
-        input_mode="json",
-        llm_enabled=False,
-        content=json.dumps(dataset["import_payload"], ensure_ascii=False),
-    )
-    assert created["success"] is True
-
-    import_detail = await _wait_for_import_task(created["task"]["task_id"])
-    assert import_detail["task"]["status"] == "completed"
-
-    for record in dataset["chat_history_records"]:
-        summarizer = summarizer_module.ChatHistorySummarizer(session_id)
-        await summarizer._import_to_long_term_memory(
-            record_id=record["record_id"],
-            theme=record["theme"],
-            summary=record["summary"],
-            participants=record["participants"],
-            start_time=record["start_time"],
-            end_time=record["end_time"],
-            original_text=record["original_text"],
-        )
-
-    for payload in dataset["person_writebacks"]:
-        await person_info_module.store_person_memory_from_answer(
-            payload["person_name"],
-            payload["memory_content"],
-            session_id,
-        )
-
-    await memory_service.episode_admin(action="process_pending", limit=100, max_retry=2)
-
-    search_case_reports: List[Dict[str, Any]] = []
-    search_accuracy_at_1 = 0.0
-    search_recall_at_5 = 0.0
-    search_precision_at_5 = 0.0
-    search_mrr = 0.0
-    search_keyword_recall = 0.0
-
-    for case in dataset["search_cases"]:
-        result = await memory_service.search(case["query"], mode="search", respect_filter=False, limit=5)
-        joined = _join_hit_content(result)
-        rank = _first_relevant_rank(result, case["expected_keywords"], case.get("minimum_keyword_hits", len(case["expected_keywords"])))
-        relevant_hits = sum(
-            1
-            for hit in result.hits[:5]
-            if _keyword_hits(_hit_blob(hit), case["expected_keywords"]) >= max(1, int(case.get("minimum_keyword_hits", len(case["expected_keywords"]))))
-        )
-        keyword_recall = _keyword_recall(joined, case["expected_keywords"])
-        search_accuracy_at_1 += 1.0 if rank == 1 else 0.0
-        search_recall_at_5 += 1.0 if rank > 0 else 0.0
-        search_precision_at_5 += relevant_hits / float(max(1, min(5, len(result.hits))))
-        search_mrr += 1.0 / float(rank) if rank > 0 else 0.0
-        search_keyword_recall += keyword_recall
-        search_case_reports.append(
-            {
-                "query": case["query"],
-                "rank_of_first_relevant": rank,
-                "relevant_hits_top5": relevant_hits,
-                "keyword_recall_top5": keyword_recall,
-                "top_hit": result.hits[0].to_dict() if result.hits else None,
-            }
-        )
-
-    search_total = max(1, len(dataset["search_cases"]))
-
-    writeback_reports: List[Dict[str, Any]] = []
-    writeback_success_rate = 0.0
-    writeback_keyword_recall = 0.0
-    for payload in dataset["person_writebacks"]:
-        query = " ".join(payload["expected_keywords"])
-        result = await memory_service.search(
-            query,
-            mode="search",
-            chat_id=session_id,
-            person_id=payload["person_id"],
-            respect_filter=False,
-            limit=5,
-        )
-        joined = _join_hit_content(result)
-        recall = _keyword_recall(joined, payload["expected_keywords"])
-        success = bool(result.hits) and recall >= 0.67
-        writeback_success_rate += 1.0 if success else 0.0
-        writeback_keyword_recall += recall
-        writeback_reports.append(
-            {
-                "person_id": payload["person_id"],
-                "success": success,
-                "keyword_recall": recall,
-                "hit_count": len(result.hits),
-            }
-        )
-    writeback_total = max(1, len(dataset["person_writebacks"]))
-
-    knowledge_reports: List[Dict[str, Any]] = []
-    knowledge_success_rate = 0.0
-    knowledge_keyword_recall = 0.0
-    fetcher = knowledge_module.KnowledgeFetcher(
-        private_name=dataset["session"]["display_name"],
-        stream_id=session_id,
-    )
-    for case in dataset["knowledge_fetcher_cases"]:
-        knowledge_text, _ = await fetcher.fetch(case["query"], [])
-        recall = _keyword_recall(knowledge_text, case["expected_keywords"])
-        success = recall >= float(case.get("minimum_keyword_recall", 1.0))
-        knowledge_success_rate += 1.0 if success else 0.0
-        knowledge_keyword_recall += recall
-        knowledge_reports.append(
-            {
-                "query": case["query"],
-                "success": success,
-                "keyword_recall": recall,
-                "preview": knowledge_text[:300],
-            }
-        )
-    knowledge_total = max(1, len(dataset["knowledge_fetcher_cases"]))
-
-    profile_reports: List[Dict[str, Any]] = []
-    profile_success_rate = 0.0
-    profile_keyword_recall = 0.0
-    profile_evidence_rate = 0.0
-    for case in dataset["profile_cases"]:
-        profile = await memory_service.get_person_profile(case["person_id"], chat_id=session_id)
-        recall = _keyword_recall(profile.summary, case["expected_keywords"])
-        has_evidence = bool(profile.evidence)
-        success = recall >= float(case.get("minimum_keyword_recall", 1.0)) and has_evidence
-        profile_success_rate += 1.0 if success else 0.0
-        profile_keyword_recall += recall
-        profile_evidence_rate += 1.0 if has_evidence else 0.0
-        profile_reports.append(
-            {
-                "person_id": case["person_id"],
-                "success": success,
-                "keyword_recall": recall,
-                "evidence_count": len(profile.evidence),
-                "summary_preview": profile.summary[:240],
-            }
-        )
-    profile_total = max(1, len(dataset["profile_cases"]))
-
-    episode_generation_auto = await _evaluate_episode_generation(session_id=session_id, episode_cases=dataset["episode_cases"])
-    episode_admin_query_auto = await _evaluate_episode_admin_query(session_id=session_id, episode_cases=dataset["episode_cases"])
-    episode_search_mode_auto = await _evaluate_episode_search_mode(session_id=session_id, episode_cases=dataset["episode_cases"])
-    episode_rebuild = await memory_service.episode_admin(
-        action="rebuild",
-        source=f"chat_summary:{session_id}",
-    )
-    episode_generation_after_rebuild = await _evaluate_episode_generation(session_id=session_id, episode_cases=dataset["episode_cases"])
-    episode_admin_query_after_rebuild = await _evaluate_episode_admin_query(session_id=session_id, episode_cases=dataset["episode_cases"])
-    episode_search_mode_after_rebuild = await _evaluate_episode_search_mode(session_id=session_id, episode_cases=dataset["episode_cases"])
-    tool_modes = await _evaluate_tool_modes(session_id=session_id, dataset=dataset)
-
-    report = {
-        "dataset": dataset["meta"],
-        "import": {
-            "task_id": created["task"]["task_id"],
-            "status": import_detail["task"]["status"],
-            "paragraph_count": len(dataset["import_payload"]["paragraphs"]),
-        },
-        "metrics": {
-            "search": {
-                "accuracy_at_1": round(search_accuracy_at_1 / search_total, 4),
-                "recall_at_5": round(search_recall_at_5 / search_total, 4),
-                "precision_at_5": round(search_precision_at_5 / search_total, 4),
-                "mrr": round(search_mrr / search_total, 4),
-                "keyword_recall_at_5": round(search_keyword_recall / search_total, 4),
-            },
-            "writeback": {
-                "success_rate": round(writeback_success_rate / writeback_total, 4),
-                "keyword_recall": round(writeback_keyword_recall / writeback_total, 4),
-            },
-            "knowledge_fetcher": {
-                "success_rate": round(knowledge_success_rate / knowledge_total, 4),
-                "keyword_recall": round(knowledge_keyword_recall / knowledge_total, 4),
-            },
-            "profile": {
-                "success_rate": round(profile_success_rate / profile_total, 4),
-                "keyword_recall": round(profile_keyword_recall / profile_total, 4),
-                "evidence_rate": round(profile_evidence_rate / profile_total, 4),
-            },
-            "tool_modes": {
-                "success_rate": tool_modes["success_rate"],
-                "keyword_recall": tool_modes["keyword_recall"],
-            },
-            "episode_generation_auto": {
-                "success_rate": episode_generation_auto["success_rate"],
-                "keyword_recall": episode_generation_auto["keyword_recall"],
-                "episode_count": episode_generation_auto["episode_count"],
-            },
-            "episode_generation_after_rebuild": {
-                "success_rate": episode_generation_after_rebuild["success_rate"],
-                "keyword_recall": episode_generation_after_rebuild["keyword_recall"],
-                "episode_count": episode_generation_after_rebuild["episode_count"],
-                "rebuild_success": bool(episode_rebuild.get("success", False)),
-            },
-            "episode_admin_query_auto": {
-                "success_rate": episode_admin_query_auto["success_rate"],
-                "keyword_recall": episode_admin_query_auto["keyword_recall"],
-            },
-            "episode_admin_query_after_rebuild": {
-                "success_rate": episode_admin_query_after_rebuild["success_rate"],
-                "keyword_recall": episode_admin_query_after_rebuild["keyword_recall"],
-                "rebuild_success": bool(episode_rebuild.get("success", False)),
-            },
-            "episode_search_mode_auto": {
-                "success_rate": episode_search_mode_auto["success_rate"],
-                "keyword_recall": episode_search_mode_auto["keyword_recall"],
-            },
-            "episode_search_mode_after_rebuild": {
-                "success_rate": episode_search_mode_after_rebuild["success_rate"],
-                "keyword_recall": episode_search_mode_after_rebuild["keyword_recall"],
-                "rebuild_success": bool(episode_rebuild.get("success", False)),
-            },
-        },
-        "cases": {
-            "search": search_case_reports,
-            "writeback": writeback_reports,
-            "knowledge_fetcher": knowledge_reports,
-            "profile": profile_reports,
-            "tool_modes": tool_modes["reports"],
-            "episode_generation_auto": episode_generation_auto["reports"],
-            "episode_generation_after_rebuild": episode_generation_after_rebuild["reports"],
-            "episode_admin_query_auto": episode_admin_query_auto["reports"],
-            "episode_admin_query_after_rebuild": episode_admin_query_after_rebuild["reports"],
-            "episode_search_mode_auto": episode_search_mode_auto["reports"],
-            "episode_search_mode_after_rebuild": episode_search_mode_after_rebuild["reports"],
-        },
-    }
-
-    REPORT_FILE.parent.mkdir(parents=True, exist_ok=True)
-    REPORT_FILE.write_text(json.dumps(report, ensure_ascii=False, indent=2), encoding="utf-8")
-    print(json.dumps(report["metrics"], ensure_ascii=False, indent=2))
-
-    assert report["import"]["status"] == "completed"
-    assert report["metrics"]["search"]["accuracy_at_1"] >= 0.35
-    assert report["metrics"]["search"]["recall_at_5"] >= 0.6
-    assert report["metrics"]["search"]["keyword_recall_at_5"] >= 0.8
-    assert report["metrics"]["writeback"]["success_rate"] >= 0.66
-    assert report["metrics"]["knowledge_fetcher"]["success_rate"] >= 0.66
-    assert report["metrics"]["knowledge_fetcher"]["keyword_recall"] >= 0.75
-    assert report["metrics"]["profile"]["success_rate"] >= 0.66
-    assert report["metrics"]["profile"]["evidence_rate"] >= 1.0
-    assert report["metrics"]["tool_modes"]["success_rate"] >= 0.75
-    assert report["metrics"]["episode_generation_after_rebuild"]["rebuild_success"] is True
-    assert report["metrics"]["episode_generation_after_rebuild"]["episode_count"] >= report["metrics"]["episode_generation_auto"]["episode_count"]
--- a/pytests/A_memorix_test/test_long_novel_memory_benchmark_live.py
+++ b/pytests/A_memorix_test/test_long_novel_memory_benchmark_live.py
@@ -1,342 +0,0 @@
-from __future__ import annotations
-
-import json
-import os
-from pathlib import Path
-from types import SimpleNamespace
-from typing import Any, Dict, List
-
-import pytest
-import pytest_asyncio
-
-from A_memorix.core.runtime.sdk_memory_kernel import SDKMemoryKernel
-from pytests.A_memorix_test.test_long_novel_memory_benchmark import (
-    _evaluate_episode_admin_query,
-    _evaluate_episode_generation,
-    _evaluate_episode_search_mode,
-    _evaluate_tool_modes,
-    _KernelBackedRuntimeManager,
-    _KnownPerson,
-    _first_relevant_rank,
-    _hit_blob,
-    _join_hit_content,
-    _keyword_hits,
-    _keyword_recall,
-    _load_benchmark_fixture,
-    _wait_for_import_task,
-)
-from src.chat.brain_chat.PFC import pfc_KnowledgeFetcher as knowledge_module
-from src.memory_system import chat_history_summarizer as summarizer_module
-from src.person_info import person_info as person_info_module
-from src.services import memory_service as memory_service_module
-from src.services.memory_service import memory_service
-
-
-pytestmark = pytest.mark.skipif(
-    os.getenv("MAIBOT_RUN_LIVE_MEMORY_TESTS") != "1",
-    reason="需要显式开启真实 external embedding benchmark",
-)
-
-REPORT_FILE = Path(__file__).parent / "data" / "benchmarks" / "results" / "long_novel_memory_benchmark_live_report.json"
-
-
-@pytest_asyncio.fixture
-async def benchmark_live_env(monkeypatch, tmp_path):
-    dataset = _load_benchmark_fixture()
-    session_cfg = dataset["session"]
-    session = SimpleNamespace(
-        session_id=session_cfg["session_id"],
-        platform=session_cfg["platform"],
-        user_id=session_cfg["user_id"],
-        group_id=session_cfg["group_id"],
-    )
-    fake_chat_manager = SimpleNamespace(
-        get_session_by_session_id=lambda session_id: session if session_id == session.session_id else None,
-        get_session_name=lambda session_id: session_cfg["display_name"] if session_id == session.session_id else session_id,
-    )
-
-    registry = {item["person_name"]: item["person_id"] for item in dataset["person_writebacks"]}
-    reverse_registry = {value: key for key, value in registry.items()}
-
-    monkeypatch.setattr(summarizer_module, "_chat_manager", fake_chat_manager)
-    monkeypatch.setattr(knowledge_module, "_chat_manager", fake_chat_manager)
-    monkeypatch.setattr(person_info_module, "_chat_manager", fake_chat_manager)
-    monkeypatch.setattr(person_info_module, "get_person_id_by_person_name", lambda person_name: registry.get(str(person_name or "").strip(), ""))
-    monkeypatch.setattr(
-        person_info_module,
-        "Person",
-        lambda person_id: _KnownPerson(person_id=str(person_id or ""), registry=registry, reverse_registry=reverse_registry),
-    )
-
-    data_dir = (tmp_path / "a_memorix_live_benchmark_data").resolve()
-    kernel = SDKMemoryKernel(
-        plugin_root=tmp_path / "plugin_root",
-        config={
-            "storage": {"data_dir": str(data_dir)},
-            "advanced": {"enable_auto_save": False},
-            "memory": {"base_decay_interval_hours": 24},
-            "person_profile": {"refresh_interval_minutes": 5},
-        },
-    )
-    manager = _KernelBackedRuntimeManager(kernel)
-    monkeypatch.setattr(memory_service_module, "a_memorix_host_service", manager)
-
-    await kernel.initialize()
-    try:
-        yield {
-            "dataset": dataset,
-            "kernel": kernel,
-            "session": session,
-        }
-    finally:
-        await kernel.shutdown()
-
-
-@pytest.mark.asyncio
-async def test_long_novel_memory_benchmark_live(benchmark_live_env):
-    dataset = benchmark_live_env["dataset"]
-    session_id = benchmark_live_env["session"].session_id
-
-    self_check = await memory_service.runtime_admin(action="refresh_self_check")
-    assert self_check["success"] is True
-    assert self_check["report"]["ok"] is True
-
-    created = await memory_service.import_admin(
-        action="create_paste",
-        name="long_novel_memory_benchmark.live.json",
-        input_mode="json",
-        llm_enabled=False,
-        content=json.dumps(dataset["import_payload"], ensure_ascii=False),
-    )
-    assert created["success"] is True
-
-    import_detail = await _wait_for_import_task(
-        created["task"]["task_id"],
-        max_rounds=2400,
-        sleep_seconds=0.25,
-    )
-    assert import_detail["task"]["status"] == "completed"
-
-    for record in dataset["chat_history_records"]:
-        summarizer = summarizer_module.ChatHistorySummarizer(session_id)
-        await summarizer._import_to_long_term_memory(
-            record_id=record["record_id"],
-            theme=record["theme"],
-            summary=record["summary"],
-            participants=record["participants"],
-            start_time=record["start_time"],
-            end_time=record["end_time"],
-            original_text=record["original_text"],
-        )
-
-    for payload in dataset["person_writebacks"]:
-        await person_info_module.store_person_memory_from_answer(
-            payload["person_name"],
-            payload["memory_content"],
-            session_id,
-        )
-
-    await memory_service.episode_admin(action="process_pending", limit=100, max_retry=2)
-
-    search_case_reports: List[Dict[str, Any]] = []
-    search_accuracy_at_1 = 0.0
-    search_recall_at_5 = 0.0
-    search_precision_at_5 = 0.0
-    search_mrr = 0.0
-    search_keyword_recall = 0.0
-    for case in dataset["search_cases"]:
-        result = await memory_service.search(case["query"], mode="search", respect_filter=False, limit=5)
-        joined = _join_hit_content(result)
-        rank = _first_relevant_rank(result, case["expected_keywords"], case.get("minimum_keyword_hits", len(case["expected_keywords"])))
-        relevant_hits = sum(
-            1
-            for hit in result.hits[:5]
-            if _keyword_hits(_hit_blob(hit), case["expected_keywords"]) >= max(1, int(case.get("minimum_keyword_hits", len(case["expected_keywords"]))))
-        )
-        keyword_recall = _keyword_recall(joined, case["expected_keywords"])
-        search_accuracy_at_1 += 1.0 if rank == 1 else 0.0
-        search_recall_at_5 += 1.0 if rank > 0 else 0.0
-        search_precision_at_5 += relevant_hits / float(max(1, min(5, len(result.hits))))
-        search_mrr += 1.0 / float(rank) if rank > 0 else 0.0
-        search_keyword_recall += keyword_recall
-        search_case_reports.append(
-            {
-                "query": case["query"],
-                "rank_of_first_relevant": rank,
-                "relevant_hits_top5": relevant_hits,
-                "keyword_recall_top5": keyword_recall,
-                "top_hit": result.hits[0].to_dict() if result.hits else None,
-            }
-        )
-    search_total = max(1, len(dataset["search_cases"]))
-
-    writeback_reports: List[Dict[str, Any]] = []
-    writeback_success_rate = 0.0
-    writeback_keyword_recall = 0.0
-    for payload in dataset["person_writebacks"]:
-        query = " ".join(payload["expected_keywords"])
-        result = await memory_service.search(
-            query,
-            mode="search",
-            chat_id=session_id,
-            person_id=payload["person_id"],
-            respect_filter=False,
-            limit=5,
-        )
-        joined = _join_hit_content(result)
-        recall = _keyword_recall(joined, payload["expected_keywords"])
-        success = bool(result.hits) and recall >= 0.67
-        writeback_success_rate += 1.0 if success else 0.0
-        writeback_keyword_recall += recall
-        writeback_reports.append(
-            {
-                "person_id": payload["person_id"],
-                "success": success,
-                "keyword_recall": recall,
-                "hit_count": len(result.hits),
-            }
-        )
-    writeback_total = max(1, len(dataset["person_writebacks"]))
-
-    knowledge_reports: List[Dict[str, Any]] = []
-    knowledge_success_rate = 0.0
-    knowledge_keyword_recall = 0.0
-    fetcher = knowledge_module.KnowledgeFetcher(
-        private_name=dataset["session"]["display_name"],
-        stream_id=session_id,
-    )
-    for case in dataset["knowledge_fetcher_cases"]:
-        knowledge_text, _ = await fetcher.fetch(case["query"], [])
-        recall = _keyword_recall(knowledge_text, case["expected_keywords"])
-        success = recall >= float(case.get("minimum_keyword_recall", 1.0))
-        knowledge_success_rate += 1.0 if success else 0.0
-        knowledge_keyword_recall += recall
-        knowledge_reports.append(
-            {
-                "query": case["query"],
-                "success": success,
-                "keyword_recall": recall,
-                "preview": knowledge_text[:300],
-            }
-        )
-    knowledge_total = max(1, len(dataset["knowledge_fetcher_cases"]))
-
-    profile_reports: List[Dict[str, Any]] = []
-    profile_success_rate = 0.0
-    profile_keyword_recall = 0.0
-    profile_evidence_rate = 0.0
-    for case in dataset["profile_cases"]:
-        profile = await memory_service.get_person_profile(case["person_id"], chat_id=session_id)
-        recall = _keyword_recall(profile.summary, case["expected_keywords"])
-        has_evidence = bool(profile.evidence)
-        success = recall >= float(case.get("minimum_keyword_recall", 1.0)) and has_evidence
-        profile_success_rate += 1.0 if success else 0.0
-        profile_keyword_recall += recall
-        profile_evidence_rate += 1.0 if has_evidence else 0.0
-        profile_reports.append(
-            {
-                "person_id": case["person_id"],
-                "success": success,
-                "keyword_recall": recall,
-                "evidence_count": len(profile.evidence),
-                "summary_preview": profile.summary[:240],
-            }
-        )
-    profile_total = max(1, len(dataset["profile_cases"]))
-
-    episode_generation_auto = await _evaluate_episode_generation(session_id=session_id, episode_cases=dataset["episode_cases"])
-    episode_admin_query_auto = await _evaluate_episode_admin_query(session_id=session_id, episode_cases=dataset["episode_cases"])
-    episode_search_mode_auto = await _evaluate_episode_search_mode(session_id=session_id, episode_cases=dataset["episode_cases"])
-    episode_rebuild = await memory_service.episode_admin(
-        action="rebuild",
-        source=f"chat_summary:{session_id}",
-    )
-    episode_generation_after_rebuild = await _evaluate_episode_generation(session_id=session_id, episode_cases=dataset["episode_cases"])
-    episode_admin_query_after_rebuild = await _evaluate_episode_admin_query(session_id=session_id, episode_cases=dataset["episode_cases"])
-    episode_search_mode_after_rebuild = await _evaluate_episode_search_mode(session_id=session_id, episode_cases=dataset["episode_cases"])
-    tool_modes = await _evaluate_tool_modes(session_id=session_id, dataset=dataset)
-
-    report = {
-        "dataset": dataset["meta"],
-        "runtime_self_check": self_check["report"],
-        "import": {
-            "task_id": created["task"]["task_id"],
-            "status": import_detail["task"]["status"],
-            "paragraph_count": len(dataset["import_payload"]["paragraphs"]),
-        },
-        "metrics": {
-            "search": {
-                "accuracy_at_1": round(search_accuracy_at_1 / search_total, 4),
-                "recall_at_5": round(search_recall_at_5 / search_total, 4),
-                "precision_at_5": round(search_precision_at_5 / search_total, 4),
-                "mrr": round(search_mrr / search_total, 4),
-                "keyword_recall_at_5": round(search_keyword_recall / search_total, 4),
-            },
-            "writeback": {
-                "success_rate": round(writeback_success_rate / writeback_total, 4),
-                "keyword_recall": round(writeback_keyword_recall / writeback_total, 4),
-            },
-            "knowledge_fetcher": {
-                "success_rate": round(knowledge_success_rate / knowledge_total, 4),
-                "keyword_recall": round(knowledge_keyword_recall / knowledge_total, 4),
-            },
-            "profile": {
-                "success_rate": round(profile_success_rate / profile_total, 4),
-                "keyword_recall": round(profile_keyword_recall / profile_total, 4),
-                "evidence_rate": round(profile_evidence_rate / profile_total, 4),
-            },
-            "tool_modes": {
-                "success_rate": tool_modes["success_rate"],
-                "keyword_recall": tool_modes["keyword_recall"],
-            },
-            "episode_generation_auto": {
-                "success_rate": episode_generation_auto["success_rate"],
-                "keyword_recall": episode_generation_auto["keyword_recall"],
-                "episode_count": episode_generation_auto["episode_count"],
-            },
-            "episode_generation_after_rebuild": {
-                "success_rate": episode_generation_after_rebuild["success_rate"],
-                "keyword_recall": episode_generation_after_rebuild["keyword_recall"],
-                "episode_count": episode_generation_after_rebuild["episode_count"],
-                "rebuild_success": bool(episode_rebuild.get("success", False)),
-            },
-            "episode_admin_query_auto": {
-                "success_rate": episode_admin_query_auto["success_rate"],
-                "keyword_recall": episode_admin_query_auto["keyword_recall"],
-            },
-            "episode_admin_query_after_rebuild": {
-                "success_rate": episode_admin_query_after_rebuild["success_rate"],
-                "keyword_recall": episode_admin_query_after_rebuild["keyword_recall"],
-                "rebuild_success": bool(episode_rebuild.get("success", False)),
-            },
-            "episode_search_mode_auto": {
-                "success_rate": episode_search_mode_auto["success_rate"],
-                "keyword_recall": episode_search_mode_auto["keyword_recall"],
-            },
-            "episode_search_mode_after_rebuild": {
-                "success_rate": episode_search_mode_after_rebuild["success_rate"],
-                "keyword_recall": episode_search_mode_after_rebuild["keyword_recall"],
-                "rebuild_success": bool(episode_rebuild.get("success", False)),
-            },
-        },
-        "cases": {
-            "search": search_case_reports,
-            "writeback": writeback_reports,
-            "knowledge_fetcher": knowledge_reports,
-            "profile": profile_reports,
-            "tool_modes": tool_modes["reports"],
-            "episode_generation_auto": episode_generation_auto["reports"],
-            "episode_generation_after_rebuild": episode_generation_after_rebuild["reports"],
-            "episode_admin_query_auto": episode_admin_query_auto["reports"],
-            "episode_admin_query_after_rebuild": episode_admin_query_after_rebuild["reports"],
-            "episode_search_mode_auto": episode_search_mode_auto["reports"],
-            "episode_search_mode_after_rebuild": episode_search_mode_after_rebuild["reports"],
-        },
-    }
-
-    REPORT_FILE.parent.mkdir(parents=True, exist_ok=True)
-    REPORT_FILE.write_text(json.dumps(report, ensure_ascii=False, indent=2), encoding="utf-8")
-    print(json.dumps(report["metrics"], ensure_ascii=False, indent=2))
-
-    assert report["import"]["status"] == "completed"
-    assert report["runtime_self_check"]["ok"] is True
--- a/pytests/A_memorix_test/test_memory_flow_service.py
+++ b/pytests/A_memorix_test/test_memory_flow_service.py
@@ -5,68 +5,6 @@ import pytest
 from src.services import memory_flow_service as memory_flow_module


-@pytest.mark.asyncio
-async def test_long_term_memory_session_manager_reuses_single_summarizer(monkeypatch):
-    starts: list[str] = []
-    summarizers: list[object] = []
-
-    class FakeSummarizer:
-        def __init__(self, session_id: str):
-            self.session_id = session_id
-            summarizers.append(self)
-
-        async def start(self):
-            starts.append(self.session_id)
-
-        async def stop(self):
-            starts.append(f"stop:{self.session_id}")
-
-    monkeypatch.setattr(
-        memory_flow_module,
-        "global_config",
-        SimpleNamespace(memory=SimpleNamespace(long_term_auto_summary_enabled=True)),
-    )
-    monkeypatch.setattr(memory_flow_module, "ChatHistorySummarizer", FakeSummarizer)
-
-    manager = memory_flow_module.LongTermMemorySessionManager()
-    message = SimpleNamespace(session_id="session-1")
-
-    await manager.on_message(message)
-    await manager.on_message(message)
-
-    assert len(summarizers) == 1
-    assert starts == ["session-1"]
-
-
-@pytest.mark.asyncio
-async def test_long_term_memory_session_manager_shutdown_stops_all(monkeypatch):
-    stopped: list[str] = []
-
-    class FakeSummarizer:
-        def __init__(self, session_id: str):
-            self.session_id = session_id
-
-        async def start(self):
-            return None
-
-        async def stop(self):
-            stopped.append(self.session_id)
-
-    monkeypatch.setattr(
-        memory_flow_module,
-        "global_config",
-        SimpleNamespace(memory=SimpleNamespace(long_term_auto_summary_enabled=True)),
-    )
-    monkeypatch.setattr(memory_flow_module, "ChatHistorySummarizer", FakeSummarizer)
-
-    manager = memory_flow_module.LongTermMemorySessionManager()
-    await manager.on_message(SimpleNamespace(session_id="session-a"))
-    await manager.on_message(SimpleNamespace(session_id="session-b"))
-    await manager.shutdown()
-
-    assert stopped == ["session-a", "session-b"]
-
-
 def test_person_fact_parse_fact_list_deduplicates_and_filters_short_items():
    raw = '["他喜欢猫", "他喜欢猫", "好", "", "他会弹吉他"]'

@@ -101,16 +39,9 @@ def test_person_fact_resolve_target_person_for_private_chat(monkeypatch):


@pytest.mark.asyncio
-async def test_memory_automation_service_auto_starts_and_delegates(monkeypatch):
+async def test_memory_automation_service_auto_starts_and_delegates():
    events: list[tuple[str, str]] = []

-    class FakeSessionManager:
-        async def on_message(self, message):
-            events.append(("incoming", message.session_id))
-
-        async def shutdown(self):
-            events.append(("shutdown", "session"))
-
    class FakeFactWriteback:
        async def start(self):
            events.append(("start", "fact"))
@@ -122,7 +53,6 @@ async def test_memory_automation_service_auto_starts_and_delegates(monkeypatch):
            events.append(("shutdown", "fact"))

    service = memory_flow_module.MemoryAutomationService()
-    service.session_manager = FakeSessionManager()
    service.fact_writeback = FakeFactWriteback()

    await service.on_incoming_message(SimpleNamespace(session_id="session-1"))
@@ -131,8 +61,6 @@ async def test_memory_automation_service_auto_starts_and_delegates(monkeypatch):

    assert events == [
        ("start", "fact"),
-        ("incoming", "session-1"),
        ("sent", "session-1"),
-        ("shutdown", "session"),
        ("shutdown", "fact"),
    ]
--- a/pytests/A_memorix_test/test_real_dialogue_business_flow_integration.py
+++ b/pytests/A_memorix_test/test_real_dialogue_business_flow_integration.py
@@ -1,324 +0,0 @@
-from __future__ import annotations
-
-import asyncio
-import inspect
-import json
-from pathlib import Path
-from types import SimpleNamespace
-from typing import Any, Dict
-
-import numpy as np
-import pytest
-import pytest_asyncio
-
-from A_memorix.core.runtime import sdk_memory_kernel as kernel_module
-from A_memorix.core.runtime.sdk_memory_kernel import KernelSearchRequest, SDKMemoryKernel
-from src.chat.brain_chat.PFC import pfc_KnowledgeFetcher as knowledge_module
-from src.memory_system import chat_history_summarizer as summarizer_module
-from src.person_info import person_info as person_info_module
-from src.services import memory_service as memory_service_module
-from src.services.memory_service import memory_service
-
-
-DATA_FILE = Path(__file__).parent / "data" / "real_dialogues" / "private_alice_weekend.json"
-
-
-def _load_dialogue_fixture() -> Dict[str, Any]:
-    return json.loads(DATA_FILE.read_text(encoding="utf-8"))
-
-
-class _FakeEmbeddingAdapter:
-    def __init__(self, dimension: int = 16) -> None:
-        self.dimension = dimension
-
-    async def _detect_dimension(self) -> int:
-        return self.dimension
-
-    async def encode(self, texts, dimensions=None):
-        dim = int(dimensions or self.dimension)
-        if isinstance(texts, str):
-            sequence = [texts]
-            single = True
-        else:
-            sequence = list(texts)
-            single = False
-
-        rows = []
-        for text in sequence:
-            vec = np.zeros(dim, dtype=np.float32)
-            for ch in str(text or ""):
-                vec[ord(ch) % dim] += 1.0
-            if not vec.any():
-                vec[0] = 1.0
-            norm = np.linalg.norm(vec)
-            if norm > 0:
-                vec = vec / norm
-            rows.append(vec)
-        payload = np.vstack(rows)
-        return payload[0] if single else payload
-
-
-class _KernelBackedRuntimeManager:
-    def __init__(self, kernel: SDKMemoryKernel) -> None:
-        self.kernel = kernel
-
-    async def invoke(self, component_name: str, args: Dict[str, Any] | None, *, timeout_ms: int = 30000):
-        del timeout_ms
-        payload = args or {}
-        if component_name == "search_memory":
-            return await self.kernel.search_memory(
-                KernelSearchRequest(
-                    query=str(payload.get("query", "") or ""),
-                    limit=int(payload.get("limit", 5) or 5),
-                    mode=str(payload.get("mode", "hybrid") or "hybrid"),
-                    chat_id=str(payload.get("chat_id", "") or ""),
-                    person_id=str(payload.get("person_id", "") or ""),
-                    time_start=payload.get("time_start"),
-                    time_end=payload.get("time_end"),
-                    respect_filter=bool(payload.get("respect_filter", True)),
-                    user_id=str(payload.get("user_id", "") or ""),
-                    group_id=str(payload.get("group_id", "") or ""),
-                )
-            )
-
-        handler = getattr(self.kernel, component_name)
-        result = handler(**payload)
-        return await result if inspect.isawaitable(result) else result
-
-
-async def _wait_for_import_task(task_id: str, *, max_rounds: int = 100) -> Dict[str, Any]:
-    for _ in range(max_rounds):
-        detail = await memory_service.import_admin(action="get", task_id=task_id, include_chunks=True)
-        task = detail.get("task") or {}
-        status = str(task.get("status", "") or "")
-        if status in {"completed", "completed_with_errors", "failed", "cancelled"}:
-            return detail
-        await asyncio.sleep(0.05)
-    raise AssertionError(f"导入任务在等待窗口内未结束: {task_id}")
-
-
-def _join_hit_content(search_result) -> str:
-    return "\n".join(hit.content for hit in search_result.hits)
-
-
-@pytest_asyncio.fixture
-async def real_dialogue_env(monkeypatch, tmp_path):
-    scenario = _load_dialogue_fixture()
-    session_cfg = scenario["session"]
-    session = SimpleNamespace(
-        session_id=session_cfg["session_id"],
-        platform=session_cfg["platform"],
-        user_id=session_cfg["user_id"],
-        group_id=session_cfg["group_id"],
-    )
-    fake_chat_manager = SimpleNamespace(
-        get_session_by_session_id=lambda session_id: session if session_id == session.session_id else None,
-        get_session_name=lambda session_id: session_cfg["display_name"] if session_id == session.session_id else session_id,
-    )
-
-    monkeypatch.setattr(kernel_module, "create_embedding_api_adapter", lambda **kwargs: _FakeEmbeddingAdapter())
-
-    async def fake_self_check(**kwargs):
-        return {"ok": True, "message": "ok"}
-
-    monkeypatch.setattr(kernel_module, "run_embedding_runtime_self_check", fake_self_check)
-    monkeypatch.setattr(summarizer_module, "_chat_manager", fake_chat_manager)
-    monkeypatch.setattr(knowledge_module, "_chat_manager", fake_chat_manager)
-    monkeypatch.setattr(person_info_module, "_chat_manager", fake_chat_manager)
-
-    data_dir = (tmp_path / "a_memorix_data").resolve()
-    kernel = SDKMemoryKernel(
-        plugin_root=tmp_path / "plugin_root",
-        config={
-            "storage": {"data_dir": str(data_dir)},
-            "advanced": {"enable_auto_save": False},
-            "memory": {"base_decay_interval_hours": 24},
-            "person_profile": {"refresh_interval_minutes": 5},
-        },
-    )
-    manager = _KernelBackedRuntimeManager(kernel)
-    monkeypatch.setattr(memory_service_module, "a_memorix_host_service", manager)
-
-    await kernel.initialize()
-    try:
-        yield {
-            "scenario": scenario,
-            "kernel": kernel,
-            "session": session,
-        }
-    finally:
-        await kernel.shutdown()
-
-
-@pytest.mark.asyncio
-async def test_real_dialogue_import_flow_makes_fixture_searchable(real_dialogue_env):
-    scenario = real_dialogue_env["scenario"]
-
-    created = await memory_service.import_admin(
-        action="create_paste",
-        name="private_alice.json",
-        input_mode="json",
-        llm_enabled=False,
-        content=json.dumps(scenario["import_payload"], ensure_ascii=False),
-    )
-
-    assert created["success"] is True
-    detail = await _wait_for_import_task(created["task"]["task_id"])
-    assert detail["task"]["status"] == "completed"
-
-    search = await memory_service.search(
-        scenario["search_queries"]["direct"],
-        mode="search",
-        respect_filter=False,
-    )
-
-    assert search.hits
-    joined = _join_hit_content(search)
-    for keyword in scenario["expectations"]["search_keywords"]:
-        assert keyword in joined
-
-
-@pytest.mark.asyncio
-async def test_real_dialogue_summarizer_flow_persists_summary_to_long_term_memory(real_dialogue_env):
-    scenario = real_dialogue_env["scenario"]
-    record = scenario["chat_history_record"]
-
-    summarizer = summarizer_module.ChatHistorySummarizer(real_dialogue_env["session"].session_id)
-    await summarizer._import_to_long_term_memory(
-        record_id=record["record_id"],
-        theme=record["theme"],
-        summary=record["summary"],
-        participants=record["participants"],
-        start_time=record["start_time"],
-        end_time=record["end_time"],
-        original_text=record["original_text"],
-    )
-
-    search = await memory_service.search(
-        scenario["search_queries"]["direct"],
-        mode="search",
-        chat_id=real_dialogue_env["session"].session_id,
-    )
-
-    assert search.hits
-    joined = _join_hit_content(search)
-    for keyword in scenario["expectations"]["search_keywords"]:
-        assert keyword in joined
-
-
-@pytest.mark.asyncio
-async def test_real_dialogue_person_fact_writeback_is_searchable(real_dialogue_env, monkeypatch):
-    scenario = real_dialogue_env["scenario"]
-
-    class _KnownPerson:
-        def __init__(self, person_id: str) -> None:
-            self.person_id = person_id
-            self.is_known = True
-            self.person_name = scenario["person"]["person_name"]
-
-    monkeypatch.setattr(
-        person_info_module,
-        "get_person_id_by_person_name",
-        lambda person_name: scenario["person"]["person_id"],
-    )
-    monkeypatch.setattr(person_info_module, "Person", _KnownPerson)
-
-    await person_info_module.store_person_memory_from_answer(
-        scenario["person"]["person_name"],
-        scenario["person_fact"]["memory_content"],
-        real_dialogue_env["session"].session_id,
-    )
-
-    search = await memory_service.search(
-        scenario["search_queries"]["direct"],
-        mode="search",
-        chat_id=real_dialogue_env["session"].session_id,
-        person_id=scenario["person"]["person_id"],
-    )
-
-    assert search.hits
-    joined = _join_hit_content(search)
-    for keyword in scenario["expectations"]["search_keywords"]:
-        assert keyword in joined
-
-
-@pytest.mark.asyncio
-async def test_real_dialogue_private_knowledge_fetcher_reads_long_term_memory(real_dialogue_env):
-    scenario = real_dialogue_env["scenario"]
-
-    await memory_service.ingest_text(
-        external_id="fixture:knowledge_fetcher",
-        source_type="dialogue_note",
-        text=scenario["person_fact"]["memory_content"],
-        chat_id=real_dialogue_env["session"].session_id,
-        person_ids=[scenario["person"]["person_id"]],
-        participants=[scenario["person"]["person_name"]],
-        respect_filter=False,
-    )
-
-    fetcher = knowledge_module.KnowledgeFetcher(
-        private_name=scenario["session"]["display_name"],
-        stream_id=real_dialogue_env["session"].session_id,
-    )
-    knowledge_text, _ = await fetcher.fetch(scenario["search_queries"]["knowledge_fetcher"], [])
-
-    for keyword in scenario["expectations"]["search_keywords"]:
-        assert keyword in knowledge_text
-
-
-@pytest.mark.asyncio
-async def test_real_dialogue_person_profile_contains_stable_traits(real_dialogue_env, monkeypatch):
-    scenario = real_dialogue_env["scenario"]
-
-    class _KnownPerson:
-        def __init__(self, person_id: str) -> None:
-            self.person_id = person_id
-            self.is_known = True
-            self.person_name = scenario["person"]["person_name"]
-
-    monkeypatch.setattr(
-        person_info_module,
-        "get_person_id_by_person_name",
-        lambda person_name: scenario["person"]["person_id"],
-    )
-    monkeypatch.setattr(person_info_module, "Person", _KnownPerson)
-
-    await person_info_module.store_person_memory_from_answer(
-        scenario["person"]["person_name"],
-        scenario["person_fact"]["memory_content"],
-        real_dialogue_env["session"].session_id,
-    )
-
-    profile = await memory_service.get_person_profile(
-        scenario["person"]["person_id"],
-        chat_id=real_dialogue_env["session"].session_id,
-    )
-
-    assert profile.evidence
-    assert any(keyword in profile.summary for keyword in scenario["expectations"]["profile_keywords"])
-
-
-@pytest.mark.asyncio
-async def test_real_dialogue_summary_flow_generates_queryable_episode(real_dialogue_env):
-    scenario = real_dialogue_env["scenario"]
-    record = scenario["chat_history_record"]
-
-    summarizer = summarizer_module.ChatHistorySummarizer(real_dialogue_env["session"].session_id)
-    await summarizer._import_to_long_term_memory(
-        record_id=record["record_id"],
-        theme=record["theme"],
-        summary=record["summary"],
-        participants=record["participants"],
-        start_time=record["start_time"],
-        end_time=record["end_time"],
-        original_text=record["original_text"],
-    )
-
-    episodes = await memory_service.episode_admin(
-        action="query",
-        source=scenario["expectations"]["episode_source"],
-        limit=5,
-    )
-
-    assert episodes["success"] is True
-    assert int(episodes["count"]) >= 1
--- a/pytests/A_memorix_test/test_real_dialogue_business_flow_live.py
+++ b/pytests/A_memorix_test/test_real_dialogue_business_flow_live.py
@@ -1,301 +0,0 @@
-from __future__ import annotations
-
-import asyncio
-import inspect
-import json
-import os
-from pathlib import Path
-from types import SimpleNamespace
-from typing import Any, Dict
-
-import pytest
-import pytest_asyncio
-
-from A_memorix.core.runtime.sdk_memory_kernel import KernelSearchRequest, SDKMemoryKernel
-from src.chat.brain_chat.PFC import pfc_KnowledgeFetcher as knowledge_module
-from src.memory_system import chat_history_summarizer as summarizer_module
-from src.person_info import person_info as person_info_module
-from src.services import memory_service as memory_service_module
-from src.services.memory_service import memory_service
-
-
-pytestmark = pytest.mark.skipif(
-    os.getenv("MAIBOT_RUN_LIVE_MEMORY_TESTS") != "1",
-    reason="需要显式开启真实 embedding / self-check 集成测试",
-)
-
-DATA_FILE = Path(__file__).parent / "data" / "real_dialogues" / "private_alice_weekend.json"
-
-
-def _load_dialogue_fixture() -> Dict[str, Any]:
-    return json.loads(DATA_FILE.read_text(encoding="utf-8"))
-
-
-class _KernelBackedRuntimeManager:
-    def __init__(self, kernel: SDKMemoryKernel) -> None:
-        self.kernel = kernel
-
-    async def invoke(self, component_name: str, args: Dict[str, Any] | None, *, timeout_ms: int = 30000):
-        del timeout_ms
-        payload = args or {}
-        if component_name == "search_memory":
-            return await self.kernel.search_memory(
-                KernelSearchRequest(
-                    query=str(payload.get("query", "") or ""),
-                    limit=int(payload.get("limit", 5) or 5),
-                    mode=str(payload.get("mode", "hybrid") or "hybrid"),
-                    chat_id=str(payload.get("chat_id", "") or ""),
-                    person_id=str(payload.get("person_id", "") or ""),
-                    time_start=payload.get("time_start"),
-                    time_end=payload.get("time_end"),
-                    respect_filter=bool(payload.get("respect_filter", True)),
-                    user_id=str(payload.get("user_id", "") or ""),
-                    group_id=str(payload.get("group_id", "") or ""),
-                )
-            )
-
-        handler = getattr(self.kernel, component_name)
-        result = handler(**payload)
-        return await result if inspect.isawaitable(result) else result
-
-
-async def _wait_for_import_task(task_id: str, *, timeout_seconds: float = 60.0) -> Dict[str, Any]:
-    deadline = asyncio.get_running_loop().time() + max(1.0, float(timeout_seconds))
-    while asyncio.get_running_loop().time() < deadline:
-        detail = await memory_service.import_admin(action="get", task_id=task_id, include_chunks=True)
-        task = detail.get("task") or {}
-        status = str(task.get("status", "") or "")
-        if status in {"completed", "completed_with_errors", "failed", "cancelled"}:
-            return detail
-        await asyncio.sleep(0.2)
-    raise AssertionError(f"导入任务在等待窗口内未结束: {task_id}")
-
-
-def _join_hit_content(search_result) -> str:
-    return "\n".join(hit.content for hit in search_result.hits)
-
-
-@pytest_asyncio.fixture
-async def live_dialogue_env(monkeypatch, tmp_path):
-    scenario = _load_dialogue_fixture()
-    session_cfg = scenario["session"]
-    session = SimpleNamespace(
-        session_id=session_cfg["session_id"],
-        platform=session_cfg["platform"],
-        user_id=session_cfg["user_id"],
-        group_id=session_cfg["group_id"],
-    )
-    fake_chat_manager = SimpleNamespace(
-        get_session_by_session_id=lambda session_id: session if session_id == session.session_id else None,
-        get_session_name=lambda session_id: session_cfg["display_name"] if session_id == session.session_id else session_id,
-    )
-
-    monkeypatch.setattr(summarizer_module, "_chat_manager", fake_chat_manager)
-    monkeypatch.setattr(knowledge_module, "_chat_manager", fake_chat_manager)
-    monkeypatch.setattr(person_info_module, "_chat_manager", fake_chat_manager)
-
-    data_dir = (tmp_path / "a_memorix_data").resolve()
-    kernel = SDKMemoryKernel(
-        plugin_root=tmp_path / "plugin_root",
-        config={
-            "storage": {"data_dir": str(data_dir)},
-            "advanced": {"enable_auto_save": False},
-            "memory": {"base_decay_interval_hours": 24},
-            "person_profile": {"refresh_interval_minutes": 5},
-        },
-    )
-    manager = _KernelBackedRuntimeManager(kernel)
-    monkeypatch.setattr(memory_service_module, "a_memorix_host_service", manager)
-
-    await kernel.initialize()
-    try:
-        yield {
-            "scenario": scenario,
-            "kernel": kernel,
-            "session": session,
-        }
-    finally:
-        await kernel.shutdown()
-
-
-@pytest.mark.asyncio
-async def test_live_runtime_self_check_passes(live_dialogue_env):
-    report = await memory_service.runtime_admin(action="refresh_self_check")
-
-    assert report["success"] is True
-    assert report["report"]["ok"] is True
-    assert report["report"]["encoded_dimension"] > 0
-
-
-@pytest.mark.asyncio
-async def test_live_import_flow_makes_fixture_searchable(live_dialogue_env):
-    scenario = live_dialogue_env["scenario"]
-
-    created = await memory_service.import_admin(
-        action="create_paste",
-        name="private_alice.json",
-        input_mode="json",
-        llm_enabled=False,
-        content=json.dumps(scenario["import_payload"], ensure_ascii=False),
-    )
-
-    assert created["success"] is True
-    detail = await _wait_for_import_task(created["task"]["task_id"])
-    assert detail["task"]["status"] == "completed"
-
-    search = await memory_service.search(
-        scenario["search_queries"]["direct"],
-        mode="search",
-        respect_filter=False,
-    )
-
-    assert search.hits
-    joined = _join_hit_content(search)
-    for keyword in scenario["expectations"]["search_keywords"]:
-        assert keyword in joined
-
-
-@pytest.mark.asyncio
-async def test_live_summarizer_flow_persists_summary_to_long_term_memory(live_dialogue_env):
-    scenario = live_dialogue_env["scenario"]
-    record = scenario["chat_history_record"]
-
-    summarizer = summarizer_module.ChatHistorySummarizer(live_dialogue_env["session"].session_id)
-    await summarizer._import_to_long_term_memory(
-        record_id=record["record_id"],
-        theme=record["theme"],
-        summary=record["summary"],
-        participants=record["participants"],
-        start_time=record["start_time"],
-        end_time=record["end_time"],
-        original_text=record["original_text"],
-    )
-
-    search = await memory_service.search(
-        scenario["search_queries"]["direct"],
-        mode="search",
-        chat_id=live_dialogue_env["session"].session_id,
-    )
-
-    assert search.hits
-    joined = _join_hit_content(search)
-    for keyword in scenario["expectations"]["search_keywords"]:
-        assert keyword in joined
-
-
-@pytest.mark.asyncio
-async def test_live_person_fact_writeback_is_searchable(live_dialogue_env, monkeypatch):
-    scenario = live_dialogue_env["scenario"]
-
-    class _KnownPerson:
-        def __init__(self, person_id: str) -> None:
-            self.person_id = person_id
-            self.is_known = True
-            self.person_name = scenario["person"]["person_name"]
-
-    monkeypatch.setattr(
-        person_info_module,
-        "get_person_id_by_person_name",
-        lambda person_name: scenario["person"]["person_id"],
-    )
-    monkeypatch.setattr(person_info_module, "Person", _KnownPerson)
-
-    await person_info_module.store_person_memory_from_answer(
-        scenario["person"]["person_name"],
-        scenario["person_fact"]["memory_content"],
-        live_dialogue_env["session"].session_id,
-    )
-
-    search = await memory_service.search(
-        scenario["search_queries"]["direct"],
-        mode="search",
-        chat_id=live_dialogue_env["session"].session_id,
-        person_id=scenario["person"]["person_id"],
-    )
-
-    assert search.hits
-    joined = _join_hit_content(search)
-    for keyword in scenario["expectations"]["search_keywords"]:
-        assert keyword in joined
-
-
-@pytest.mark.asyncio
-async def test_live_private_knowledge_fetcher_reads_long_term_memory(live_dialogue_env):
-    scenario = live_dialogue_env["scenario"]
-
-    await memory_service.ingest_text(
-        external_id="fixture:knowledge_fetcher",
-        source_type="dialogue_note",
-        text=scenario["person_fact"]["memory_content"],
-        chat_id=live_dialogue_env["session"].session_id,
-        person_ids=[scenario["person"]["person_id"]],
-        participants=[scenario["person"]["person_name"]],
-        respect_filter=False,
-    )
-
-    fetcher = knowledge_module.KnowledgeFetcher(
-        private_name=scenario["session"]["display_name"],
-        stream_id=live_dialogue_env["session"].session_id,
-    )
-    knowledge_text, _ = await fetcher.fetch(scenario["search_queries"]["knowledge_fetcher"], [])
-
-    for keyword in scenario["expectations"]["search_keywords"]:
-        assert keyword in knowledge_text
-
-
-@pytest.mark.asyncio
-async def test_live_person_profile_contains_stable_traits(live_dialogue_env, monkeypatch):
-    scenario = live_dialogue_env["scenario"]
-
-    class _KnownPerson:
-        def __init__(self, person_id: str) -> None:
-            self.person_id = person_id
-            self.is_known = True
-            self.person_name = scenario["person"]["person_name"]
-
-    monkeypatch.setattr(
-        person_info_module,
-        "get_person_id_by_person_name",
-        lambda person_name: scenario["person"]["person_id"],
-    )
-    monkeypatch.setattr(person_info_module, "Person", _KnownPerson)
-
-    await person_info_module.store_person_memory_from_answer(
-        scenario["person"]["person_name"],
-        scenario["person_fact"]["memory_content"],
-        live_dialogue_env["session"].session_id,
-    )
-
-    profile = await memory_service.get_person_profile(
-        scenario["person"]["person_id"],
-        chat_id=live_dialogue_env["session"].session_id,
-    )
-
-    assert profile.evidence
-    assert any(keyword in profile.summary for keyword in scenario["expectations"]["profile_keywords"])
-
-
-@pytest.mark.asyncio
-async def test_live_summary_flow_generates_queryable_episode(live_dialogue_env):
-    scenario = live_dialogue_env["scenario"]
-    record = scenario["chat_history_record"]
-
-    summarizer = summarizer_module.ChatHistorySummarizer(live_dialogue_env["session"].session_id)
-    await summarizer._import_to_long_term_memory(
-        record_id=record["record_id"],
-        theme=record["theme"],
-        summary=record["summary"],
-        participants=record["participants"],
-        start_time=record["start_time"],
-        end_time=record["end_time"],
-        original_text=record["original_text"],
-    )
-
-    episodes = await memory_service.episode_admin(
-        action="query",
-        source=scenario["expectations"]["episode_source"],
-        limit=5,
-    )
-
-    assert episodes["success"] is True
-    assert int(episodes["count"]) >= 1
--- a/src/chat/message_receive/bot.py
+++ b/src/chat/message_receive/bot.py
@@ -612,13 +612,6 @@ class ChatBot:
                scope=scope,
            )  # 确保会话存在

-            try:
-                from src.services.memory_flow_service import memory_automation_service
-
-                await memory_automation_service.on_incoming_message(message)
-            except Exception as exc:
-                logger.warning(f"[{session_id}] 长期记忆自动摘要注册失败: {exc}")
-
            # message.update_chat_stream(chat)

            # 命令处理 - 使用新插件系统检查并处理命令。
--- a/src/common/logger_color_and_mapping.py
+++ b/src/common/logger_color_and_mapping.py
@@ -159,7 +159,6 @@ MODULE_ALIASES = {
    "planner": "规划器",
    "config": "配置",
    "main": "主程序",
-    "chat_history_summarizer": "聊天概括器",
    "plugin_runtime.integration": "IPC插件系统",
    "plugin_runtime.host.supervisor": "插件监督器",
    "plugin_runtime.host.runner_manager": "插件监督器",
--- a/src/config/config.py
+++ b/src/config/config.py
@@ -55,7 +55,7 @@ BOT_CONFIG_PATH: Path = (CONFIG_DIR / "bot_config.toml").resolve().absolute()
 MODEL_CONFIG_PATH: Path = (CONFIG_DIR / "model_config.toml").resolve().absolute()
 LEGACY_ENV_PATH: Path = (PROJECT_ROOT / ".env").resolve().absolute()
 MMC_VERSION: str = "1.0.0"
-CONFIG_VERSION: str = "8.7.1"
+CONFIG_VERSION: str = "8.8.0"
 MODEL_CONFIG_VERSION: str = "1.14.0"

 logger = get_logger("config")
--- a/src/config/official_configs.py
+++ b/src/config/official_configs.py
@@ -414,95 +414,6 @@ class MemoryConfig(ConfigBase):
    )
    """Maisaka 内置长期记忆检索工具 query_memory 的默认返回条数"""

-    long_term_auto_summary_enabled: bool = Field(
-        default=True,
-        json_schema_extra={
-            "x-widget": "switch",
-            "x-icon": "book-open",
-        },
-    )
-    """是否自动启动聊天总结并导入长期记忆"""
-
-    person_fact_writeback_enabled: bool = Field(
-        default=True,
-        json_schema_extra={
-            "x-widget": "switch",
-            "x-icon": "user-round-pen",
-        },
-    )
-    """是否在发送回复后自动提取并写回人物事实到长期记忆"""
-    chat_history_topic_check_message_threshold: int = Field(
-        default=80,
-        ge=1,
-        json_schema_extra={
-            "x-widget": "input",
-            "x-icon": "hash",
-        },
-    )
-    """聊天历史话题检查的消息数量阈值，当累积消息数达到此值时触发话题检查"""
-
-    chat_history_topic_check_time_hours: float = Field(
-        default=8.0,
-        json_schema_extra={
-            "x-widget": "input",
-            "x-icon": "clock",
-        },
-    )
-    """聊天历史话题检查的时间阈值（小时），当距离上次检查超过此时间且消息数达到最小阈值时触发话题检查"""
-
-    chat_history_topic_check_min_messages: int = Field(
-        default=20,
-        ge=1,
-        json_schema_extra={
-            "x-widget": "input",
-            "x-icon": "hash",
-        },
-    )
-    """聊天历史话题检查的时间触发模式下的最小消息数阈值"""
-
-    chat_history_finalize_no_update_checks: int = Field(
-        default=3,
-        ge=1,
-        json_schema_extra={
-            "x-widget": "input",
-            "x-icon": "check-circle",
-        },
-    )
-    """聊天历史话题打包存储的连续无更新检查次数阈值，当话题连续N次检查无新增内容时触发打包存储"""
-
-    chat_history_finalize_message_count: int = Field(
-        default=5,
-        ge=1,
-        json_schema_extra={
-            "x-widget": "input",
-            "x-icon": "package",
-        },
-    )
-    """聊天历史话题打包存储的消息条数阈值，当话题的消息条数超过此值时触发打包存储"""
-
-    def model_post_init(self, context: Optional[dict] = None) -> None:
-        """验证配置值"""
-        if self.chat_history_topic_check_message_threshold < 1:
-            raise ValueError(
-                f"chat_history_topic_check_message_threshold 必须至少为1，当前值: {self.chat_history_topic_check_message_threshold}"
-            )
-        if self.chat_history_topic_check_time_hours <= 0:
-            raise ValueError(
-                f"chat_history_topic_check_time_hours 必须大于0，当前值: {self.chat_history_topic_check_time_hours}"
-            )
-        if self.chat_history_topic_check_min_messages < 1:
-            raise ValueError(
-                f"chat_history_topic_check_min_messages 必须至少为1，当前值: {self.chat_history_topic_check_min_messages}"
-            )
-        if self.chat_history_finalize_no_update_checks < 1:
-            raise ValueError(
-                f"chat_history_finalize_no_update_checks 必须至少为1，当前值: {self.chat_history_finalize_no_update_checks}"
-            )
-        if self.chat_history_finalize_message_count < 1:
-            raise ValueError(
-                f"chat_history_finalize_message_count 必须至少为1，当前值: {self.chat_history_finalize_message_count}"
-            )
-        return super().model_post_init(context)


 class LearningItem(ConfigBase):
--- a/src/maisaka/builtin_tool/send_emoji.py
+++ b/src/maisaka/builtin_tool/send_emoji.py
@@ -53,40 +53,16 @@ def get_tool_spec() -> ToolSpec:
    return ToolSpec(
        name="send_emoji",
        brief_description="发送一个合适的表情包来辅助表达情绪。",
-        detailed_description="参数说明：\n- emotion：string，可选。希望表达的情绪，例如 happy、sad、angry 等。",
+        detailed_description="无需参数，直接发送一个合适的表情包。",
        parameters_schema={
            "type": "object",
-            "properties": {
-                "emotion": {
-                    "type": "string",
-                    "description": "希望表达的情绪，例如 happy、sad、angry 等。",
-                },
-            },
+            "properties": {},
        },
        provider_name="maisaka_builtin",
        provider_type="builtin",
    )


-def _normalize_candidate_emotions(emoji: MaiEmoji) -> list[str]:
-    """清洗候选表情上的情绪标签。"""
-
-    raw_emotions = getattr(emoji, "emotion", None)
-    if isinstance(raw_emotions, list) and raw_emotions:
-        return [str(item).strip() for item in raw_emotions if str(item).strip()]
-
-    description = str(getattr(emoji, "description", "") or "").strip()
-    if not description:
-        return []
-
-    normalized_description = (
-        description.replace("，", ",")
-        .replace("、", ",")
-        .replace("；", ",")
-    )
-    return [item.strip() for item in normalized_description.split(",") if item.strip()]
-
-
 async def _load_emoji_bytes(emoji: MaiEmoji) -> bytes:
    """读取单个表情包图片字节。"""

@@ -232,18 +208,6 @@ async def _build_emoji_candidate_message(emojis: list[MaiEmoji]) -> SessionBacke
    )


-def _build_emoji_candidate_summary(emojis: list[MaiEmoji]) -> str:
-    """构建供监控展示使用的候选表情摘要。"""
-
-    summary_lines: list[str] = []
-    for index, emoji in enumerate(emojis, start=1):
-        description = emoji.description.strip() or "（无描述）"
-        emotions = "、".join(_normalize_candidate_emotions(emoji)) or "无"
-        summary_lines.append(f"{index}. 描述：{description}")
-        summary_lines.append(f"   情绪：{emotions}")
-    return "\n".join(summary_lines).strip()
-
-
 def _build_send_emoji_monitor_detail(
    *,
    request_messages: Optional[list[dict[str, Any]]] = None,
@@ -252,7 +216,7 @@ def _build_send_emoji_monitor_detail(
    metrics: Optional[Dict[str, Any]] = None,
    extra_sections: Optional[list[dict[str, str]]] = None,
 ) -> Dict[str, Any]:
-    """构建 emotion tool 统一监控详情。"""
+    """构建 send_emoji 工具统一监控详情。"""

    detail: Dict[str, Any] = {}
    if isinstance(request_messages, list) and request_messages:
@@ -281,7 +245,6 @@ def _build_send_emoji_monitor_detail(
 def _build_send_emoji_monitor_metadata(
    selection_metadata: Dict[str, Any],
    *,
-    requested_emotion: str,
    send_result: Optional[Any] = None,
    error_message: str = "",
 ) -> Dict[str, Any]:
@@ -293,7 +256,6 @@ def _build_send_emoji_monitor_metadata(

    if send_result is not None:
        result_lines = [
-            f"请求情绪：{requested_emotion or '未指定'}",
            f"命中情绪：{send_result.matched_emotion or '未命中'}",
            f"表情描述：{send_result.description or '无描述'}",
            f"情绪标签：{'、'.join(send_result.emotions) if send_result.emotions else '无'}",
@@ -306,10 +268,7 @@ def _build_send_emoji_monitor_metadata(
    elif error_message.strip():
        extra_sections.append({
            "title": "表情发送结果",
-            "content": (
-                f"请求情绪：{requested_emotion or '未指定'}\n"
-                f"发送结果：{error_message.strip()}"
-            ),
+            "content": f"发送结果：{error_message.strip()}",
        })

    if extra_sections:
@@ -322,7 +281,6 @@ def _build_send_emoji_monitor_metadata(

 async def _select_emoji_with_sub_agent(
    tool_ctx: BuiltinToolRuntimeContext,
-    requested_emotion: str,
    reasoning: str,
    context_texts: list[str],
    sample_size: int,
@@ -347,14 +305,12 @@ async def _select_emoji_with_sub_agent(
        f"一共 {len(sampled_emojis)} 个位置。\n"
        f"每张小图左上角都有一个较大的序号，范围是 1 到 {len(sampled_emojis)}。\n"
        f"你的任务是根据上下文和当前语气，从这 {len(sampled_emojis)} 张图里选出最合适的一张表情包。\n"
-        "如果提供了 requested_emotion，请优先考虑与其接近的候选；如果没有完全匹配，则选择最符合上下文语气的候选。\n"
        "你必须返回一个 JSON 对象（json object），不要输出任何 JSON 之外的内容。\n"
        '返回格式固定为：{"emoji_index":1,"reason":"简短理由"}'
    )
    prompt_message = ReferenceMessage(
        content=(
            f"[选择任务]\n"
-            f"requested_emotion: {requested_emotion or '未指定'}\n"
            f"候选总数: {len(sampled_emojis)}\n"
            f"拼图布局: {grid_rows}x{grid_columns}\n"
            "请只输出 JSON。"
@@ -439,7 +395,6 @@ async def handle_tool(
    """执行 send_emoji 内置工具。"""

    del context
-    emotion = str(invocation.arguments.get("emotion") or "").strip()
    context_texts = [
        message.processed_plain_text.strip()
        for message in tool_ctx.runtime._chat_history[-5:]
@@ -450,23 +405,20 @@ async def handle_tool(
        "message": "",
        "description": "",
        "emotion": [],
-        "requested_emotion": emotion,
        "matched_emotion": "",
        "reason": "",
    }
    selection_metadata: Dict[str, Any] = {"reason": "", "monitor_detail": {}}

-    logger.info(f"{tool_ctx.runtime.log_prefix} 触发表情包发送工具，请求情绪={emotion!r}")
+    logger.info(f"{tool_ctx.runtime.log_prefix} 触发表情包发送工具")

    try:
        send_result = await send_emoji_for_maisaka(
            stream_id=tool_ctx.runtime.session_id,
-            requested_emotion=emotion,
            reasoning=tool_ctx.engine.last_reasoning_content,
            context_texts=context_texts,
-            emoji_selector=lambda requested_emotion, reasoning, context_texts, sample_size: _select_emoji_with_sub_agent(
+            emoji_selector=lambda _requested_emotion, reasoning, context_texts, sample_size: _select_emoji_with_sub_agent(
                tool_ctx,
-                requested_emotion,
                reasoning,
                list(context_texts or []),
                sample_size,
@@ -482,7 +434,6 @@ async def handle_tool(
            structured_content=structured_result,
            metadata=_build_send_emoji_monitor_metadata(
                selection_metadata,
-                requested_emotion=emotion,
                error_message=structured_result["message"],
            ),
        )
@@ -493,7 +444,7 @@ async def handle_tool(
        logger.info(
            f"{tool_ctx.runtime.log_prefix} 表情包发送成功 "
            f"描述={send_result.description!r} 情绪标签={send_result.emotions} "
-            f"请求情绪={emotion!r} 命中情绪={send_result.matched_emotion!r}"
+            f"命中情绪={send_result.matched_emotion!r}"
        )
        if send_result.sent_message is not None:
            tool_ctx.append_sent_message_to_chat_history(send_result.sent_message)
@@ -509,7 +460,6 @@ async def handle_tool(
            structured_content=structured_result,
            metadata=_build_send_emoji_monitor_metadata(
                selection_metadata,
-                requested_emotion=emotion,
                send_result=send_result,
            ),
        )
@@ -521,7 +471,7 @@ async def handle_tool(

    logger.warning(
        f"{tool_ctx.runtime.log_prefix} 表情包发送失败 "
-        f"请求情绪={emotion!r} 错误信息={send_result.message}"
+        f"错误信息={send_result.message}"
    )
    return tool_ctx.build_failure_result(
        invocation.tool_name,
@@ -529,7 +479,6 @@ async def handle_tool(
        structured_content=structured_result,
        metadata=_build_send_emoji_monitor_metadata(
            selection_metadata,
-            requested_emotion=emotion,
            send_result=send_result,
        ),
    )
--- a/src/maisaka/chat_loop_service.py
+++ b/src/maisaka/chat_loop_service.py
@@ -528,14 +528,12 @@ class MaisakaChatLoopService:

        prompt_section: RenderableType | None = None
        if global_config.debug.show_maisaka_thinking:
-            image_display_mode: str = "path_link" if global_config.maisaka.show_image_path else "legacy"
            prompt_section = PromptCLIVisualizer.build_prompt_section(
                built_messages,
                category="planner" if request_kind != "timing_gate" else "timing_gate",
                chat_id=self._session_id,
                request_kind=request_kind,
                selection_reason=selection_reason,
-                image_display_mode=image_display_mode,
                folded=global_config.debug.fold_maisaka_thinking,
                tool_definitions=list(all_tools),
            )
--- a/src/maisaka/display/prompt_cli_renderer.py
+++ b/src/maisaka/display/prompt_cli_renderer.py
@@ -799,7 +799,7 @@ class PromptCLIVisualizer:
        chat_id: str,
        request_kind: str,
        selection_reason: str,
-        image_display_mode: Literal["legacy", "path_link"],
+        image_display_mode: Literal["legacy", "path_link"] = "path_link",
        tool_definitions: list[dict[str, Any]] | None = None,
    ) -> RenderableType:
        """构建用于查看完整 prompt 的折叠入口内容。"""
@@ -864,7 +864,7 @@ class PromptCLIVisualizer:
        chat_id: str,
        request_kind: str,
        selection_reason: str,
-        image_display_mode: Literal["legacy", "path_link"],
+        image_display_mode: Literal["legacy", "path_link"] = "path_link",
        folded: bool,
        tool_definitions: list[dict[str, Any]] | None = None,
    ) -> Panel:
@@ -878,14 +878,10 @@ class PromptCLIVisualizer:
                chat_id=chat_id,
                request_kind=request_kind,
                selection_reason=selection_reason,
-                image_display_mode=image_display_mode,
                tool_definitions=tool_definitions,
            )
        else:
-            ordered_panels = cls.build_prompt_panels(
-                messages,
-                image_display_mode=image_display_mode,
-            )
+            ordered_panels = cls.build_prompt_panels(messages)
            prompt_renderable = Group(*ordered_panels)

        return Panel(
@@ -1102,11 +1098,9 @@ class PromptCLIVisualizer:
        cls,
        messages: list[Any],
        *,
-        image_display_mode: Literal["legacy", "path_link"],
+        image_display_mode: Literal["legacy", "path_link"] = "path_link",
    ) -> List[Panel]:
        """构建完整 prompt 可视化面板。"""
-        if image_display_mode not in {mode.value for mode in PromptImageDisplayMode}:
-            image_display_mode = PromptImageDisplayMode.LEGACY
        settings = PromptImageDisplaySettings(
            display_mode=PromptImageDisplayMode(image_display_mode),
        )
--- a/src/maisaka/runtime.py
+++ b/src/maisaka/runtime.py
@@ -1151,7 +1151,6 @@ class MaisakaHeartFlowChatting:
                        chat_id=self.session_id,
                        request_kind=labels["request_kind"],
                        selection_reason=subtitle,
-                        image_display_mode="path_link" if global_config.maisaka.show_image_path else "legacy",
                    ),
                    title=labels["prompt_title"],
                    border_style=border_style,
--- a/src/memory_system/chat_history_summarizer.py
+++ b/src/memory_system/chat_history_summarizer.py
--- a/src/services/memory_flow_service.py
+++ b/src/services/memory_flow_service.py
@@ -2,54 +2,20 @@ from __future__ import annotations

 import asyncio
 import json
-from typing import Any, Dict, List, Optional
+from typing import Any, List, Optional

 from json_repair import repair_json

 from src.chat.utils.utils import is_bot_self
-from src.common.message_repository import find_messages
 from src.common.logger import get_logger
+from src.common.message_repository import find_messages
 from src.config.config import global_config
-from src.memory_system.chat_history_summarizer import ChatHistorySummarizer
 from src.person_info.person_info import Person, get_person_id, store_person_memory_from_answer
 from src.services.llm_service import LLMServiceClient

 logger = get_logger("memory_flow_service")


-class LongTermMemorySessionManager:
-    def __init__(self) -> None:
-        self._lock = asyncio.Lock()
-        self._summarizers: Dict[str, ChatHistorySummarizer] = {}
-
-    async def on_message(self, message: Any) -> None:
-        if not bool(getattr(global_config.memory, "long_term_auto_summary_enabled", True)):
-            return
-        session_id = str(getattr(message, "session_id", "") or "").strip()
-        if not session_id:
-            return
-
-        created = False
-        async with self._lock:
-            summarizer = self._summarizers.get(session_id)
-            if summarizer is None:
-                summarizer = ChatHistorySummarizer(session_id=session_id)
-                self._summarizers[session_id] = summarizer
-                created = True
-        if created:
-            await summarizer.start()
-
-    async def shutdown(self) -> None:
-        async with self._lock:
-            items = list(self._summarizers.items())
-            self._summarizers.clear()
-        for session_id, summarizer in items:
-            try:
-                await summarizer.stop()
-            except Exception as exc:
-                logger.warning("停止聊天总结器失败: session=%s err=%s", session_id, exc)
-
-
 class PersonFactWritebackService:
    def __init__(self) -> None:
        self._queue: asyncio.Queue[Any] = asyncio.Queue(maxsize=256)
@@ -123,7 +89,11 @@ class PersonFactWritebackService:
        if not session_id:
            return

-        person_name = str(getattr(target_person, "person_name", "") or getattr(target_person, "nickname", "") or "").strip()
+        person_name = str(
+            getattr(target_person, "person_name", "")
+            or getattr(target_person, "nickname", "")
+            or ""
+        ).strip()
        if not person_name:
            return

@@ -242,7 +212,6 @@ class PersonFactWritebackService:

 class MemoryAutomationService:
    def __init__(self) -> None:
-        self.session_manager = LongTermMemorySessionManager()
        self.fact_writeback = PersonFactWritebackService()
        self._started = False

@@ -255,14 +224,13 @@ class MemoryAutomationService:
    async def shutdown(self) -> None:
        if not self._started:
            return
-        await self.session_manager.shutdown()
        await self.fact_writeback.shutdown()
        self._started = False

    async def on_incoming_message(self, message: Any) -> None:
+        del message
        if not self._started:
            await self.start()
-        await self.session_manager.on_message(message)

    async def on_message_sent(self, message: Any) -> None:
        if not self._started: