Ruff fix

2025-11-13 13:24:55 +08:00
parent e78a070fbd
commit 7839acd25d
52 changed files with 1322 additions and 1408 deletions
--- a/src/express/express_utils.py
+++ b/src/express/express_utils.py
@@ -3,31 +3,30 @@ import difflib
 import random
 from datetime import datetime
 from typing import Optional, List, Dict
-from collections import defaultdict


 def filter_message_content(content: Optional[str]) -> str:
    """
    过滤消息内容，移除回复、@、图片等格式
-    
+
    Args:
        content: 原始消息内容
-        
+
    Returns:
        str: 过滤后的内容
    """
    if not content:
        return ""
-        
+
    # 移除以[回复开头、]结尾的部分，包括后面的"，说："部分
-    content = re.sub(r'\[回复.*?\]，说：\s*', '', content)
+    content = re.sub(r"\[回复.*?\]，说：\s*", "", content)
    # 移除@<...>格式的内容
-    content = re.sub(r'@<[^>]*>', '', content)
+    content = re.sub(r"@<[^>]*>", "", content)
    # 移除[picid:...]格式的图片ID
-    content = re.sub(r'\[picid:[^\]]*\]', '', content)
+    content = re.sub(r"\[picid:[^\]]*\]", "", content)
    # 移除[表情包：...]格式的内容
-    content = re.sub(r'\[表情包：[^\]]*\]', '', content)
-    
+    content = re.sub(r"\[表情包：[^\]]*\]", "", content)
+
    return content.strip()


@@ -35,11 +34,11 @@ def calculate_similarity(text1: str, text2: str) -> float:
    """
    计算两个文本的相似度，返回0-1之间的值
    使用SequenceMatcher计算相似度
-    
+
    Args:
        text1: 第一个文本
        text2: 第二个文本
-        
+
    Returns:
        float: 相似度值，范围0-1
    """
@@ -49,10 +48,10 @@ def calculate_similarity(text1: str, text2: str) -> float:
 def format_create_date(timestamp: float) -> str:
    """
    将时间戳格式化为可读的日期字符串
-    
+
    Args:
        timestamp: 时间戳
-        
+
    Returns:
        str: 格式化后的日期字符串
    """
@@ -65,11 +64,11 @@ def format_create_date(timestamp: float) -> str:
 def weighted_sample(population: List[Dict], k: int) -> List[Dict]:
    """
    随机抽样函数
-    
+
    Args:
        population: 总体数据列表
        k: 需要抽取的数量
-        
+
    Returns:
        List[Dict]: 抽取的数据列表
    """