Files
mai-bot/plugins/A_memorix/scripts/backfill_temporal_metadata.py
DawnARC 71b3a828c6 添加 A_Memorix 插件 v2.0.0(包含运行时与文档)
引入 A_Memorix 插件 v2.0.0:新增大量运行时组件、存储/模式更新、检索能力提升、管理工具、导入/调优工作流以及相关文档。关键新增内容包括:lifecycle_orchestrator、SDKMemoryKernel/运行时初始化器、新的存储层与 metadata_store 变更(SCHEMA_VERSION v8)、检索增强(双路径检索、图关系召回、稀疏 BM25),以及多种工具服务(episode/person_profile/relation/segmentation/tuning/search execution)。同时新增 Web 导入/摘要导入器及大量维护脚本。还更新了插件清单、embedding API 适配器、plugin.py、requirements/pyproject,以及主入口文件,使新插件接入项目。该变更为 2.0.0 版本发布做好准备,实现统一的 SDK Tool 接口并扩展整体运行能力。
2026-03-19 00:09:04 +08:00

74 lines
2.0 KiB
Python

#!/usr/bin/env python3
"""
回填段落时序字段。
默认策略:
1. 若段落缺失 event_time/event_time_start/event_time_end
2. 且存在 created_at
3. 写入 event_time=created_at, time_granularity=day, time_confidence=0.2
"""
from __future__ import annotations
import argparse
from pathlib import Path
import sys
CURRENT_DIR = Path(__file__).resolve().parent
PLUGIN_ROOT = CURRENT_DIR.parent
PROJECT_ROOT = PLUGIN_ROOT.parent.parent
sys.path.insert(0, str(PROJECT_ROOT))
from plugins.A_memorix.core.storage import MetadataStore # noqa: E402
def backfill(
data_dir: Path,
dry_run: bool,
limit: int,
no_created_fallback: bool,
) -> int:
store = MetadataStore(data_dir=data_dir)
store.connect()
summary = store.backfill_temporal_metadata_from_created_at(
limit=limit,
dry_run=dry_run,
no_created_fallback=no_created_fallback,
)
store.close()
if dry_run:
print(f"[dry-run] candidates={summary['candidates']}")
return int(summary["candidates"])
if no_created_fallback:
print(f"skip update (no-created-fallback), candidates={summary['candidates']}")
return 0
print(f"updated={summary['updated']}")
return int(summary["updated"])
def main() -> int:
parser = argparse.ArgumentParser(description="Backfill temporal metadata for A_Memorix paragraphs")
parser.add_argument("--data-dir", default=str(PLUGIN_ROOT / "data"), help="数据目录")
parser.add_argument("--dry-run", action="store_true", help="仅统计,不写入")
parser.add_argument("--limit", type=int, default=100000, help="最大处理条数")
parser.add_argument(
"--no-created-fallback",
action="store_true",
help="不使用 created_at 回填,仅输出候选数量",
)
args = parser.parse_args()
backfill(
data_dir=Path(args.data_dir),
dry_run=args.dry_run,
limit=max(1, int(args.limit)),
no_created_fallback=args.no_created_fallback,
)
return 0
if __name__ == "__main__":
raise SystemExit(main())