Ruff Format

2026-02-21 16:24:24 +08:00
parent 2cb512120b
commit eaef7f0e98
82 changed files with 1881 additions and 1900 deletions
--- a/scripts/test_memory_retrieval.py
+++ b/scripts/test_memory_retrieval.py
@@ -28,53 +28,55 @@ from maim_message import UserInfo, GroupInfo

 logger = get_logger("test_memory_retrieval")

+
 # 使用 importlib 动态导入，避免循环导入问题
 def _import_memory_retrieval():
    """使用 importlib 动态导入 memory_retrieval 模块，避免循环导入"""
    try:
        # 先导入 prompt_builder，检查 prompt 是否已经初始化
        from src.chat.utils.prompt_builder import global_prompt_manager
-        
+
        # 检查 memory_retrieval 相关的 prompt 是否已经注册
        # 如果已经注册，说明模块可能已经通过其他路径初始化过了
        prompt_already_init = "memory_retrieval_question_prompt" in global_prompt_manager._prompts
-        
+
        module_name = "src.memory_system.memory_retrieval"
-        
+
        # 如果 prompt 已经初始化，尝试直接使用已加载的模块
        if prompt_already_init and module_name in sys.modules:
            existing_module = sys.modules[module_name]
-            if hasattr(existing_module, 'init_memory_retrieval_prompt'):
+            if hasattr(existing_module, "init_memory_retrieval_prompt"):
                return (
                    existing_module.init_memory_retrieval_prompt,
                    existing_module._react_agent_solve_question,
                    existing_module._process_single_question,
                )
-        
+
        # 如果模块已经在 sys.modules 中但部分初始化，先移除它
        if module_name in sys.modules:
            existing_module = sys.modules[module_name]
-            if not hasattr(existing_module, 'init_memory_retrieval_prompt'):
+            if not hasattr(existing_module, "init_memory_retrieval_prompt"):
                # 模块部分初始化，移除它
                logger.warning(f"检测到部分初始化的模块 {module_name}，尝试重新导入")
                del sys.modules[module_name]
                # 清理可能相关的部分初始化模块
                keys_to_remove = []
                for key in sys.modules.keys():
-                    if key.startswith('src.memory_system.') and key != 'src.memory_system':
+                    if key.startswith("src.memory_system.") and key != "src.memory_system":
                        keys_to_remove.append(key)
                for key in keys_to_remove:
                    try:
                        del sys.modules[key]
                    except KeyError:
                        pass
-        
+
        # 在导入 memory_retrieval 之前，先确保所有可能触发循环导入的模块都已完全加载
        # 这些模块在导入时可能会触发 memory_retrieval 的导入，所以我们需要先加载它们
        try:
            # 先导入可能触发循环导入的模块，让它们完成初始化
            import src.config.config
            import src.chat.utils.prompt_builder
+
            # 尝试导入可能触发循环导入的模块（这些模块可能在模块级别导入了 memory_retrieval）
            # 如果它们已经导入，就确保它们完全初始化
            # 尝试导入可能触发循环导入的模块（这些模块可能在模块级别导入了 memory_retrieval）
@@ -89,11 +91,11 @@ def _import_memory_retrieval():
                pass  # 如果导入失败，继续
        except Exception as e:
            logger.warning(f"预加载依赖模块时出现警告: {e}")
-        
+
        # 现在尝试导入 memory_retrieval
        # 如果此时仍然触发循环导入，说明有其他模块在模块级别导入了 memory_retrieval
        memory_retrieval_module = importlib.import_module(module_name)
-        
+
        return (
            memory_retrieval_module.init_memory_retrieval_prompt,
            memory_retrieval_module._react_agent_solve_question,
@@ -126,16 +128,16 @@ def create_test_chat_stream(chat_id: str = "test_memory_retrieval") -> ChatStrea

 def get_token_usage_since(start_time: float) -> Dict[str, Any]:
    """获取从指定时间开始的token使用情况
-    
+
    Args:
        start_time: 开始时间戳
-        
+
    Returns:
        包含token使用统计的字典
    """
    try:
        start_datetime = datetime.fromtimestamp(start_time)
-        
+
        # 查询从开始时间到现在的所有memory相关的token使用记录
        records = (
            LLMUsage.select()
@@ -150,21 +152,21 @@ def get_token_usage_since(start_time: float) -> Dict[str, Any]:
            )
            .order_by(LLMUsage.timestamp.asc())
        )
-        
+
        total_prompt_tokens = 0
        total_completion_tokens = 0
        total_tokens = 0
        total_cost = 0.0
        request_count = 0
        model_usage = {}  # 按模型统计
-        
+
        for record in records:
            total_prompt_tokens += record.prompt_tokens or 0
            total_completion_tokens += record.completion_tokens or 0
            total_tokens += record.total_tokens or 0
            total_cost += record.cost or 0.0
            request_count += 1
-            
+
            # 按模型统计
            model_name = record.model_name or "unknown"
            if model_name not in model_usage:
@@ -180,7 +182,7 @@ def get_token_usage_since(start_time: float) -> Dict[str, Any]:
            model_usage[model_name]["total_tokens"] += record.total_tokens or 0
            model_usage[model_name]["cost"] += record.cost or 0.0
            model_usage[model_name]["request_count"] += 1
-        
+
        return {
            "total_prompt_tokens": total_prompt_tokens,
            "total_completion_tokens": total_completion_tokens,
@@ -205,25 +207,25 @@ def format_thinking_steps(thinking_steps: list) -> str:
    """格式化思考步骤为可读字符串"""
    if not thinking_steps:
        return "无思考步骤"
-    
+
    lines = []
    for step in thinking_steps:
        iteration = step.get("iteration", "?")
        thought = step.get("thought", "")
        actions = step.get("actions", [])
        observations = step.get("observations", [])
-        
+
        lines.append(f"\n--- 迭代 {iteration} ---")
        if thought:
            lines.append(f"思考: {thought[:200]}...")
-        
+
        if actions:
            lines.append("行动:")
            for action in actions:
                action_type = action.get("action_type", "unknown")
                action_params = action.get("action_params", {})
                lines.append(f"  - {action_type}: {json.dumps(action_params, ensure_ascii=False)}")
-        
+
        if observations:
            lines.append("观察:")
            for obs in observations:
@@ -231,7 +233,7 @@ def format_thinking_steps(thinking_steps: list) -> str:
                if len(str(obs)) > 200:
                    obs_str += "..."
                lines.append(f"  - {obs_str}")
-    
+
    return "\n".join(lines)


@@ -242,31 +244,32 @@ async def test_memory_retrieval(
    max_iterations: Optional[int] = None,
 ) -> Dict[str, Any]:
    """测试记忆检索功能
-    
+
    Args:
        question: 要查询的问题
        chat_id: 聊天ID
        context: 上下文信息
        max_iterations: 最大迭代次数
-        
+
    Returns:
        包含测试结果的字典
    """
    print("\n" + "=" * 80)
-    print(f"[测试] 记忆检索测试")
+    print("[测试] 记忆检索测试")
    print(f"[问题] {question}")
    print("=" * 80)
-    
+
    # 记录开始时间
    start_time = time.time()
-    
+
    # 延迟导入并初始化记忆检索prompt（这会自动加载 global_config）
    # 注意：必须在函数内部调用，避免在模块级别触发循环导入
    try:
        init_memory_retrieval_prompt, _react_agent_solve_question, _ = _import_memory_retrieval()
-        
+
        # 检查 prompt 是否已经初始化，避免重复初始化
        from src.chat.utils.prompt_builder import global_prompt_manager
+
        if "memory_retrieval_question_prompt" not in global_prompt_manager._prompts:
            init_memory_retrieval_prompt()
        else:
@@ -274,24 +277,24 @@ async def test_memory_retrieval(
    except Exception as e:
        logger.error(f"初始化记忆检索模块失败: {e}", exc_info=True)
        raise
-    
+
    # 获取 global_config（此时应该已经加载）
    from src.config.config import global_config
-    
+
    # 直接调用 _react_agent_solve_question 来获取详细的迭代信息
    if max_iterations is None:
        max_iterations = global_config.memory.max_agent_iterations
-    
+
    timeout = global_config.memory.agent_timeout_seconds
-    
-    print(f"\n[配置]")
+
+    print("\n[配置]")
    print(f"  最大迭代次数: {max_iterations}")
    print(f"  超时时间: {timeout}秒")
    print(f"  聊天ID: {chat_id}")
-    
+
    # 执行检索
    print(f"\n[开始检索] {time.strftime('%Y-%m-%d %H:%M:%S', time.localtime())}")
-    
+
    found_answer, answer, thinking_steps, is_timeout = await _react_agent_solve_question(
        question=question,
        chat_id=chat_id,
@@ -299,14 +302,14 @@ async def test_memory_retrieval(
        timeout=timeout,
        initial_info="",
    )
-    
+
    # 记录结束时间
    end_time = time.time()
    elapsed_time = end_time - start_time
-    
+
    # 获取token使用情况
    token_usage = get_token_usage_since(start_time)
-    
+
    # 构建结果
    result = {
        "question": question,
@@ -318,41 +321,41 @@ async def test_memory_retrieval(
        "iteration_count": len(thinking_steps),
        "token_usage": token_usage,
    }
-    
+
    # 输出结果
    print(f"\n[检索完成] {time.strftime('%Y-%m-%d %H:%M:%S', time.localtime())}")
-    print(f"\n[结果]")
+    print("\n[结果]")
    print(f"  是否找到答案: {'是' if found_answer else '否'}")
    if found_answer and answer:
        print(f"  答案: {answer}")
    else:
-        print(f"  答案: (未找到答案)")
+        print("  答案: (未找到答案)")
    print(f"  是否超时: {'是' if is_timeout else '否'}")
    print(f"  迭代次数: {len(thinking_steps)}")
    print(f"  总耗时: {elapsed_time:.2f}秒")
-    
-    print(f"\n[Token使用情况]")
+
+    print("\n[Token使用情况]")
    print(f"  总请求数: {token_usage['request_count']}")
    print(f"  总Prompt Tokens: {token_usage['total_prompt_tokens']:,}")
    print(f"  总Completion Tokens: {token_usage['total_completion_tokens']:,}")
    print(f"  总Tokens: {token_usage['total_tokens']:,}")
    print(f"  总成本: ${token_usage['total_cost']:.6f}")
-    
-    if token_usage['model_usage']:
-        print(f"\n[按模型统计]")
-        for model_name, usage in token_usage['model_usage'].items():
+
+    if token_usage["model_usage"]:
+        print("\n[按模型统计]")
+        for model_name, usage in token_usage["model_usage"].items():
            print(f"  {model_name}:")
            print(f"    请求数: {usage['request_count']}")
            print(f"    Prompt Tokens: {usage['prompt_tokens']:,}")
            print(f"    Completion Tokens: {usage['completion_tokens']:,}")
            print(f"    总Tokens: {usage['total_tokens']:,}")
            print(f"    成本: ${usage['cost']:.6f}")
-    
-    print(f"\n[迭代详情]")
+
+    print("\n[迭代详情]")
    print(format_thinking_steps(thinking_steps))
-    
+
    print("\n" + "=" * 80)
-    
+
    return result


@@ -375,12 +378,12 @@ def main() -> None:
        "-o",
        help="将结果保存到JSON文件（可选）",
    )
-    
+
    args = parser.parse_args()
-    
+
    # 初始化日志（使用较低的详细程度，避免输出过多日志）
    initialize_logging(verbose=False)
-    
+
    # 交互式输入问题
    print("\n" + "=" * 80)
    print("记忆检索测试工具")
@@ -389,7 +392,7 @@ def main() -> None:
    if not question:
        print("错误: 问题不能为空")
        return
-    
+
    # 交互式输入最大迭代次数
    max_iterations_input = input("\n请输入最大迭代次数（直接回车使用配置默认值）: ").strip()
    max_iterations = None
@@ -402,7 +405,7 @@ def main() -> None:
        except ValueError:
            print("警告: 无效的迭代次数，将使用配置默认值")
            max_iterations = None
-    
+
    # 连接数据库
    try:
        db.connect(reuse_if_open=True)
@@ -410,7 +413,7 @@ def main() -> None:
        logger.error(f"数据库连接失败: {e}")
        print(f"错误: 数据库连接失败: {e}")
        return
-    
+
    # 运行测试
    try:
        result = asyncio.run(
@@ -421,7 +424,7 @@ def main() -> None:
                max_iterations=max_iterations,
            )
        )
-        
+
        # 如果指定了输出文件，保存结果
        if args.output:
            # 将thinking_steps转换为可序列化的格式
@@ -429,7 +432,7 @@ def main() -> None:
            with open(args.output, "w", encoding="utf-8") as f:
                json.dump(output_result, f, ensure_ascii=False, indent=2)
            print(f"\n[结果已保存] {args.output}")
-        
+
    except KeyboardInterrupt:
        print("\n\n[中断] 用户中断测试")
    except Exception as e:
@@ -444,4 +447,3 @@ def main() -> None:

 if __name__ == "__main__":
    main()
-