feat: 统一对task中过慢的模型进行警告，并在model_config.toml中设定对应task的慢请求阈值

2025-11-29 21:50:49 +08:00
parent dc84366bb5
commit 78f3b75352
5 changed files with 37 additions and 8 deletions
--- a/template/model_config_template.toml
+++ b/template/model_config_template.toml
@@ -1,5 +1,5 @@
 [inner]
-version = "1.8.1"
+version = "1.8.2"

 # 配置文件版本号迭代规则同bot_config.toml

@@ -135,37 +135,45 @@ price_out = 0
 model_list = ["siliconflow-deepseek-v3.2"] # 使用的模型列表，每个子项对应上面的模型名称(name)
 temperature = 0.2                        # 模型温度，新V3建议0.1-0.3
 max_tokens = 2048                         # 最大输出token数
+slow_threshold = 15.0                     # 慢请求阈值（秒），模型等待回复时间超过此值会输出警告日志

 [model_task_config.utils_small] # 在麦麦的一些组件中使用的小模型，消耗量较大，建议使用速度较快的小模型
 model_list = ["qwen3-30b","qwen3-next-80b"]
 temperature = 0.7
 max_tokens = 2048
+slow_threshold = 10.0

 [model_task_config.tool_use] #工具调用模型，需要使用支持工具调用的模型
 model_list = ["qwen3-30b","qwen3-next-80b"]
 temperature = 0.7
 max_tokens = 800
+slow_threshold = 10.0

 [model_task_config.replyer] # 首要回复模型，还用于表达器和表达方式学习
 model_list = ["siliconflow-deepseek-v3.2","siliconflow-deepseek-v3.2-think","siliconflow-glm-4.6","siliconflow-glm-4.6-think"]
 temperature = 0.3                        # 模型温度，新V3建议0.1-0.3
 max_tokens = 2048
+slow_threshold = 25.0

 [model_task_config.planner] #决策：负责决定麦麦该什么时候回复的模型
 model_list = ["siliconflow-deepseek-v3.2"]
 temperature = 0.3
 max_tokens = 800
+slow_threshold = 12.0

 [model_task_config.vlm] # 图像识别模型
 model_list = ["qwen3-vl-30"]
 max_tokens = 256
+slow_threshold = 15.0

 [model_task_config.voice] # 语音识别模型
 model_list = ["sensevoice-small"]
+slow_threshold = 12.0

 # 嵌入模型
 [model_task_config.embedding]
 model_list = ["bge-m3"]
+slow_threshold = 5.0

 # ------------LPMM知识库模型------------

@@ -173,13 +181,16 @@ model_list = ["bge-m3"]
 model_list = ["siliconflow-deepseek-v3.2"]
 temperature = 0.2
 max_tokens = 800
+slow_threshold = 20.0

 [model_task_config.lpmm_rdf_build] # RDF构建模型
 model_list = ["siliconflow-deepseek-v3.2"]
 temperature = 0.2
 max_tokens = 800
+slow_threshold = 20.0

 [model_task_config.lpmm_qa] # 问答模型
 model_list = ["siliconflow-deepseek-v3.2"]
 temperature = 0.7
 max_tokens = 800
+slow_threshold = 20.0