feat：处理器处理时间上限，处理并行模式，planner和思考prompt，循环观察器大优化

feat：增加了处理器处理时间上限，记忆处理并行模式，优化了planner和思考prompt，优化了循环观察器
2025-05-30 11:04:29 +08:00
parent 8f0a4d9d2c
commit 54724ae21e
21 changed files with 233 additions and 120 deletions
--- a/src/chat/heart_flow/observation/hfcloop_observation.py
+++ b/src/chat/heart_flow/observation/hfcloop_observation.py
@@ -27,40 +27,62 @@ class HFCloopObservation:
        recent_active_cycles: List[CycleDetail] = []
        for cycle in reversed(self.history_loop):
            # 只关心实际执行了动作的循环
-            action_taken = cycle.loop_action_info["action_taken"]
-            if action_taken:
-                recent_active_cycles.append(cycle)
-                if len(recent_active_cycles) == 5:
-                    break
+            # action_taken = cycle.loop_action_info["action_taken"]
+            # if action_taken:
+            recent_active_cycles.append(cycle)
+            if len(recent_active_cycles) == 5:
+                break

        cycle_info_block = ""
+        action_detailed_str = ""
        consecutive_text_replies = 0
        responses_for_prompt = []

        # 检查这最近的活动循环中有多少是连续的文本回复 (从最近的开始看)
        for cycle in recent_active_cycles:
            action_type = cycle.loop_plan_info["action_result"]["action_type"]
+            action_reasoning = cycle.loop_plan_info["action_result"]["reasoning"]
+            is_taken = cycle.loop_action_info["action_taken"]
+            action_taken_time = cycle.loop_action_info["taken_time"]
+            action_taken_time_str = datetime.fromtimestamp(action_taken_time).strftime("%H:%M:%S")
+            # print(action_type)
+            # print(action_reasoning)
+            # print(is_taken)
+            # print(action_taken_time_str)
+            # print("--------------------------------")
            if action_type == "reply":
                consecutive_text_replies += 1
                response_text = cycle.loop_plan_info["action_result"]["action_data"].get("text", "[空回复]")
                responses_for_prompt.append(response_text)
+                
+                if is_taken:
+                    action_detailed_str += f"{action_taken_time_str}时，你选择回复(action:{action_type},内容是:'{response_text}')。你选择这个action的原因是:{action_reasoning}\n"
+                else:
+                    action_detailed_str += f"{action_taken_time_str}时，你选择回复(action:{action_type},内容是:'{response_text}')，但是动作失败了。你选择这个action的原因是:{action_reasoning}\n"
+            elif action_type == "no_reply":
+                action_detailed_str += f"{action_taken_time_str}时，你选择不回复(action:{action_type})，你选择了沉默，原因是:{action_reasoning}\n"
            else:
-                break
-
+                if is_taken:
+                    action_detailed_str += f"{action_taken_time_str}时，你选择执行了(action:{action_type})，你选择这个action的原因是:{action_reasoning}\n"
+                else:
+                    action_detailed_str += f"{action_taken_time_str}时，你选择执行了(action:{action_type})，但是动作失败了。你选择这个action的原因是:{action_reasoning}\n"
+                
+        if action_detailed_str:
+            cycle_info_block = f"\n你最近做的事：\n{action_detailed_str}\n"
+        else:
+            cycle_info_block = "\n"
+        
        # 根据连续文本回复的数量构建提示信息
-        # 注意: responses_for_prompt 列表是从最近到最远排序的
        if consecutive_text_replies >= 3:  # 如果最近的三个活动都是文本回复
            cycle_info_block = f'你已经连续回复了三条消息（最近: "{responses_for_prompt[0]}"，第二近: "{responses_for_prompt[1]}"，第三近: "{responses_for_prompt[2]}"）。你回复的有点多了，请注意'
        elif consecutive_text_replies == 2:  # 如果最近的两个活动是文本回复
            cycle_info_block = f'你已经连续回复了两条消息（最近: "{responses_for_prompt[0]}"，第二近: "{responses_for_prompt[1]}"），请注意'
-        elif consecutive_text_replies == 1:  # 如果最近的一个活动是文本回复
-            cycle_info_block = f'你刚刚已经回复一条消息（内容: "{responses_for_prompt[0]}"）'

        # 包装提示块，增加可读性，即使没有连续回复也给个标记
-        if cycle_info_block:
-            cycle_info_block = f"\n你最近的回复\n{cycle_info_block}\n"
-        else:
-            cycle_info_block = "\n"
+        # if cycle_info_block:
+        #     cycle_info_block = f"\n你最近的回复\n{cycle_info_block}\n"
+        # else:
+        #     cycle_info_block = "\n"

        # 获取history_loop中最新添加的
        if self.history_loop:
@@ -70,10 +92,19 @@ class HFCloopObservation:
            if start_time is not None and end_time is not None:
                time_diff = int(end_time - start_time)
                if time_diff > 60:
-                    cycle_info_block += f"\n距离你上一次阅读消息已经过去了{time_diff / 60}分钟\n"
+                    cycle_info_block += f"距离你上一次阅读消息并思考和规划，已经过去了{int(time_diff / 60)}分钟\n"
                else:
-                    cycle_info_block += f"\n距离你上一次阅读消息已经过去了{time_diff}秒\n"
+                    cycle_info_block += f"距离你上一次阅读消息并思考和规划，已经过去了{time_diff}秒\n"
            else:
-                cycle_info_block += "\n你还没看过消息\n"
+                cycle_info_block += "你还没看过消息\n"

        self.observe_info = cycle_info_block
+
+    def to_dict(self) -> dict:
+        """将观察对象转换为可序列化的字典"""
+        return {
+            "observe_info": self.observe_info,
+            "observe_id": self.observe_id,
+            "last_observe_time": self.last_observe_time,
+            "history_loop": [cycle.to_dict() for cycle in self.history_loop]
+        }