S

MemoryVectorSearchbyzc

MemoryVectorSearchbyzc

已认证
AI v1.0.0 · 小杨
下载 ZIP
📥 下载 139 次 📦 8.5KB 📅 2026-05-25

MemoryVectorSearchbyzc

Description

统一的记忆向量检索技能。基于 BGE‑ONNX 嵌入和 Chromadb‑Document‑Vectorizer,实现:

  • 语义向量检索(512 维 L2‑归一化)
  • BM25 + 向量混合检索(RRF 融合),use_hybrid_search=True
  • 增量向量化(新增/更新记忆文件)
  • 向量库大小监控与自动清理(可配置阈值)
  • 完全自包含:复制 MemoryVectorSearchbyzc/ 目录到另一台机器即可直接使用(只要模型文件路径可达)。

Files

  • memory_vector_searchbyzc.py – 主实现,提供 MemoryVectorSearchbyzc 类。
  • requirements.txt – 依赖列表(onnxruntime、numpy、rank_bm25)。
  • config.json – 默认配置,可自行覆盖路径、大小阈值等。
  • SKILL.md – 本说明文件。

Usage

from skills.MemoryVectorSearchbyzc.memory_vector_searchbyzc import MemoryVectorSearchbyzc

# 初始化(读取 config.json)
searcher = MemoryVectorSearchbyzc()

# 语义检索(混合检索已开启)
results = searcher.search("OpenClaw 多 Agent 协作系统", top_k=5)
for r in results:
    print(r['similarity'], r['content'][:200])

# 增量添加新记忆文件
searcher.add_file(r"C:\\path\\to\\new_note.md")

# 手动触发库大小检查与清理(亦可在 cron 中调用)
searcher.run_maintenance()

Configuration (config.json)

{
  "bge_model_path": "C:/Users/Administrator/bge-small-zh-v1.5-onnx/onnx/model.onnx",
  "vector_store_dir": "C:/Users/Administrator/.openclaw/workspace/memory_vectors",
  "use_hybrid_search": true,
  "size_limit_mb": 500,
  "cleanup_keep_latest": 30
}
  • size_limit_mb:向量库超过该大小(MB)时自动触发清理。
  • cleanup_keep_latest:保留最近 N 天的切片不被删除。

Dependencies (requirements.txt)

onnnxruntime
numpy
rank_bm25

Notes

  • 所有日志均使用 [INFO][WARN] 前缀,避免 Unicode Emoji,兼容 Windows GBK 控制台。
  • 复制技能目录到另一台机器后,只需确保 config.json 中的 bge_model_pathvector_store_dir 正确即可立即使用。

💡 安装方法

下载 ZIP 解压到 skills/ 目录即可使用