Commit Graph

13 Commits

Author SHA1 Message Date
墨梓柒
3231995ebd feat: 增强 WebUI 配置,支持防爬虫和安全 Cookie 设置 2025-12-19 00:44:22 +08:00
陈曦
f41c2113dc feat:为 LPMM 流水线脚本添加非交互模式
为 info_extraction.py、import_openie.py、delete_lpmm_items.py 以及新增的 lpmm_manager.py 引入统一的 --non-interactive 参数,使其能够在 CI 和自动化场景下实现完全脚本化、无交互运行。新增了一个功能完整的命令行管理脚本(lpmm_manager.py)以及一份详细的用户指南(lpmm_pipelines_guide.md)。同时,更新了 test_lpmm_retrieval.py,以支持通过 CLI 自定义测试用例,并改进了整个流水线中的错误处理和用户提示。最后,从文档和代码中移除了 ppr_relation_cap 参数。
2025-12-18 20:40:05 +08:00
陈曦
1383caf249 LPMM 知识库删除能力与自检脚本增强(附关键健壮性修复)
为 LPMM 新增安全可控的删除能力:
KGManager.delete_paragraphs 支持按段落/实体哈希删除图节点及关联边,可选清理孤立实体,并从图中重建元数据
统一删除脚本 scripts/delete_lpmm_items.py,支持按批次(OpenIE 文件)、哈希文件、原始文本段落、关键字搜索进行删除,内置 dry-run 和最大节点数保护
新增自检与回归脚本:
scripts/inspect_lpmm_batch.py / scripts/inspect_lpmm_global.py 用于批次级和全局状态检查
scripts/test_lpmm_retrieval.py 一键初始化 LPMM 并用固定问题测试检索效果。
健壮性与性能保护:
在 KGManager.kg_search 中对 ent_appear_cnt 缺失增加兜底,避免实体权重计算时的 KeyError。
增加同义实体数量限制与 PPR 节点/关系阈值,必要时自动退回纯向量检索
文档补充:
docs-src/lpmm_user_guide.md:面向零基础用户的导入 / 删除 / 自检脚本使用指南
docs-src/lpmm_parameters_guide.md:[lpmm_knowledge] 关键参数说明与简单调参建议
2025-11-27 13:20:12 +08:00
墨梓柒
163dbb6b90 超级Ruff 2025-09-09 19:25:12 +08:00
墨梓柒
42e00dd0aa 更新KGManager和知识库配置,统一使用global_config的lpmm_knowledge属性,移除未使用的MemoryActiveManager导入 2025-08-03 11:27:34 +08:00
墨梓柒
5725481097 重构KGManager类,移除对local_storage的依赖,简化KG目录路径获取逻辑 2025-08-03 11:19:20 +08:00
UnCLAS-Prommer
52acfe5958 knowledge系统对应修改 2025-07-31 13:38:56 +08:00
UnCLAS-Prommer
32cb4dc726 some typing 2025-07-19 19:14:52 +08:00
墨梓柒
eb716f1e46 fix:修复实体和段落节点不存在时的处理逻辑 2025-07-16 21:02:01 +08:00
墨梓柒
956232d493 feat: 优化KG目录路径获取逻辑,支持备用路径
fix: 修复local_storage设置默认值的逻辑
2025-07-15 15:45:50 +08:00
墨梓柒
e339f0b228 feat: 移除不必要的命名空间导入,优化本地存储初始化 2025-07-08 00:18:19 +08:00
墨梓柒
ab2b7ec9ed feat: 知识库小重构x2 2025-06-07 13:46:24 +08:00
墨梓柒
0038d9ff60 feat: 知识库小重构 2025-06-07 13:46:04 +08:00