引入 A_Memorix 插件 v2.0.0:新增大量运行时组件、存储/模式更新、检索能力提升、管理工具、导入/调优工作流以及相关文档。关键新增内容包括:lifecycle_orchestrator、SDKMemoryKernel/运行时初始化器、新的存储层与 metadata_store 变更(SCHEMA_VERSION v8)、检索增强(双路径检索、图关系召回、稀疏 BM25),以及多种工具服务(episode/person_profile/relation/segmentation/tuning/search execution)。同时新增 Web 导入/摘要导入器及大量维护脚本。还更新了插件清单、embedding API 适配器、plugin.py、requirements/pyproject,以及主入口文件,使新插件接入项目。该变更为 2.0.0 版本发布做好准备,实现统一的 SDK Tool 接口并扩展整体运行能力。
74 lines
2.0 KiB
Python
74 lines
2.0 KiB
Python
#!/usr/bin/env python3
|
|
"""
|
|
回填段落时序字段。
|
|
|
|
默认策略:
|
|
1. 若段落缺失 event_time/event_time_start/event_time_end
|
|
2. 且存在 created_at
|
|
3. 写入 event_time=created_at, time_granularity=day, time_confidence=0.2
|
|
"""
|
|
|
|
from __future__ import annotations
|
|
|
|
import argparse
|
|
from pathlib import Path
|
|
import sys
|
|
|
|
|
|
CURRENT_DIR = Path(__file__).resolve().parent
|
|
PLUGIN_ROOT = CURRENT_DIR.parent
|
|
PROJECT_ROOT = PLUGIN_ROOT.parent.parent
|
|
sys.path.insert(0, str(PROJECT_ROOT))
|
|
|
|
from plugins.A_memorix.core.storage import MetadataStore # noqa: E402
|
|
|
|
|
|
def backfill(
|
|
data_dir: Path,
|
|
dry_run: bool,
|
|
limit: int,
|
|
no_created_fallback: bool,
|
|
) -> int:
|
|
store = MetadataStore(data_dir=data_dir)
|
|
store.connect()
|
|
summary = store.backfill_temporal_metadata_from_created_at(
|
|
limit=limit,
|
|
dry_run=dry_run,
|
|
no_created_fallback=no_created_fallback,
|
|
)
|
|
store.close()
|
|
if dry_run:
|
|
print(f"[dry-run] candidates={summary['candidates']}")
|
|
return int(summary["candidates"])
|
|
if no_created_fallback:
|
|
print(f"skip update (no-created-fallback), candidates={summary['candidates']}")
|
|
return 0
|
|
print(f"updated={summary['updated']}")
|
|
return int(summary["updated"])
|
|
|
|
|
|
def main() -> int:
|
|
parser = argparse.ArgumentParser(description="Backfill temporal metadata for A_Memorix paragraphs")
|
|
parser.add_argument("--data-dir", default=str(PLUGIN_ROOT / "data"), help="数据目录")
|
|
parser.add_argument("--dry-run", action="store_true", help="仅统计,不写入")
|
|
parser.add_argument("--limit", type=int, default=100000, help="最大处理条数")
|
|
parser.add_argument(
|
|
"--no-created-fallback",
|
|
action="store_true",
|
|
help="不使用 created_at 回填,仅输出候选数量",
|
|
)
|
|
args = parser.parse_args()
|
|
|
|
backfill(
|
|
data_dir=Path(args.data_dir),
|
|
dry_run=args.dry_run,
|
|
limit=max(1, int(args.limit)),
|
|
no_created_fallback=args.no_created_fallback,
|
|
)
|
|
return 0
|
|
|
|
|
|
if __name__ == "__main__":
|
|
raise SystemExit(main())
|
|
|