MemoryVectorSearchbyzc
已认证
AI
v1.0.0 · 小杨
📥 下载 139 次
📦 8.5KB
📅 2026-05-25
MemoryVectorSearchbyzc
Description
统一的记忆向量检索技能。基于 BGE‑ONNX 嵌入和 Chromadb‑Document‑Vectorizer,实现:
- 语义向量检索(512 维 L2‑归一化)
- BM25 + 向量混合检索(RRF 融合),
use_hybrid_search=True - 增量向量化(新增/更新记忆文件)
- 向量库大小监控与自动清理(可配置阈值)
- 完全自包含:复制
MemoryVectorSearchbyzc/目录到另一台机器即可直接使用(只要模型文件路径可达)。
Files
memory_vector_searchbyzc.py– 主实现,提供MemoryVectorSearchbyzc类。requirements.txt– 依赖列表(onnxruntime、numpy、rank_bm25)。config.json– 默认配置,可自行覆盖路径、大小阈值等。SKILL.md– 本说明文件。
Usage
from skills.MemoryVectorSearchbyzc.memory_vector_searchbyzc import MemoryVectorSearchbyzc
# 初始化(读取 config.json)
searcher = MemoryVectorSearchbyzc()
# 语义检索(混合检索已开启)
results = searcher.search("OpenClaw 多 Agent 协作系统", top_k=5)
for r in results:
print(r['similarity'], r['content'][:200])
# 增量添加新记忆文件
searcher.add_file(r"C:\\path\\to\\new_note.md")
# 手动触发库大小检查与清理(亦可在 cron 中调用)
searcher.run_maintenance()
Configuration (config.json)
{
"bge_model_path": "C:/Users/Administrator/bge-small-zh-v1.5-onnx/onnx/model.onnx",
"vector_store_dir": "C:/Users/Administrator/.openclaw/workspace/memory_vectors",
"use_hybrid_search": true,
"size_limit_mb": 500,
"cleanup_keep_latest": 30
}
size_limit_mb:向量库超过该大小(MB)时自动触发清理。cleanup_keep_latest:保留最近 N 天的切片不被删除。
Dependencies (requirements.txt)
onnnxruntime
numpy
rank_bm25
Notes
- 所有日志均使用
[INFO]、[WARN]前缀,避免 Unicode Emoji,兼容 Windows GBK 控制台。 - 复制技能目录到另一台机器后,只需确保
config.json中的bge_model_path与vector_store_dir正确即可立即使用。
💡 安装方法
下载 ZIP 解压到 skills/ 目录即可使用