forked from DevOps/deploy.stack
- 添加 scram-sha-256 认证方式及初始化参数 - 新增 DB 端口和 dataplane API URL 变量 - 移除 huggingface 缓存卷挂载 - 修正 LLM provider 值为小写 minimax
Hindsight 部署栈
vectorize-io/hindsight 是一个面向 LLM Agent 的长期记忆后端,采用 PostgreSQL/pgvector 存储。Hermes Agent 用它做跨会话长期记忆。
本目录是 方案三:DB + Hindsight 分离部署(/home/geng/hindsight/ 下的 docker-compose.yaml + .env + pgdata/)迁移到 deploy.stack 仓库的版本。
目录结构
| 文件 | 说明 |
|---|---|
stack.yml |
Docker Compose 主文件(2 服务:db + hindsight) |
env.cfg.example |
公共环境变量模板(不含敏感信息,可提交) |
env.cfg |
敏感配置(gitignore,不提交) — 实际部署时从 example 复制后填密码/API Key |
backup.job |
每日 pg_dump 热备份脚本,保留 7 天 |
readme.md |
本文档 |
架构
┌──────────────────────┐ 5432 ┌──────────────────────┐
│ hindsight-app 容器 │ ────────────► │ hindsight-db 容器 │
│ (ghcr.nju.edu.cn/ │ │ (pgvector/pgvector │
│ vectorize-io/ │ :8888 API │ :pg18) │
│ hindsight) │ :9999 Admin │ │
└──────────────────────┘ └──────────────────────┘
│ │
▼ bind mount ▼ bind mount
~/.cache/huggingface /home/geng/hindsight/pgdata
(BGE + ms-marco 复用) (PG 数据,WSL 原生 fs)
部署步骤
首次部署
# 1. 准备数据目录(WSL/Linux 原生 fs,不能放 /mnt/9P)
sudo mkdir -pv /home/geng/hindsight/pgdata /home/geng/hindsight/backups
sudo chown -R 999:999 /home/geng/hindsight/pgdata
# 2. 复制 env 模板并填入真实值
cp env.cfg.example env.cfg
$EDITOR env.cfg
# 必填:HINDSIGHT_DB_PASSWORD, HINDSIGHT_API_LLM_API_KEY
# 3. 拉镜像
docker compose --env-file ./hindsight/env.cfg -f ./hindsight/stack.yml pull
# 4. 启动
docker compose -p hindsight --env-file ./hindsight/env.cfg -f ./hindsight/stack.yml up -d
验证
# 容器状态
docker ps -f name=hindsight
# DB 启动正常(首次启动会建表)
docker exec -it hindsight-db psql -U hindsight_user -d hindsight_db -c '\dt'
# 端口监听
ss -tlnp | grep -E '8888|9999'
# API 健康检查
curl -s http://localhost:8888/health
停止/重启
# 停止(保留数据)
docker compose -p hindsight --env-file ./hindsight/env.cfg -f ./hindsight/stack.yml stop
# 完全销毁(**数据不删**,bind 挂载保留在宿主机)
docker compose -p hindsight --env-file ./hindsight/env.cfg -f ./hindsight/stack.yml down
# 重启
docker compose -p hindsight --env-file ./hindsight/env.cfg -f ./hindsight/stack.yml restart
关键设计决策
| 决策点 | 决定 | 原因 |
|---|---|---|
| 部署位置 | /home/geng/hindsight/(WSL 原生 fs) |
/mnt/d/mydata/ 是 9P drvfs,PG 在 9P 上 fsync 不可靠会损坏数据;Hindsight 跟随 Hermes 配置放 ~/ 下 |
| 数据卷方案 | bind 挂载到 ~/hindsight/pgdata |
直观、可直接 rsync/pg_dump、跨机迁移用 tar 整个目录即可(用户决策,覆盖默认命名卷) |
| 端口绑定 | 0.0.0.0:8888 / 0.0.0.0:9999 | PVE LAN 上其他 VM 也可能访问(用户决策) |
| 镜像源 | ghcr.nju.edu.cn/vectorize-io/hindsight |
南京大学 ghcr 镜像,国内拉得快(用户偏好) |
| LLM | MiniMax-M3 via api.minimaxi.com | 用 MiniMax 的 OpenAI-compatible 协议 |
| 嵌入模型 | 容器内自带 BGE-small-en-v1.5 | 不需要额外配;HF 缓存 bind 复用免重下 |
| 旧数据迁移 | 见 docs-hermes-Hindsight-记忆系统部署指南.md 决策表 |
走 A(zip 导入) 或 B(重置新 DB) 路径 |
备份与恢复
自动备份
backup.job 是 pg_dump 热备份脚本(不停服),落盘到 bind 挂载的 backups/。接入 cron:
# /etc/cron.d/hindsight-backup 或 crontab -e
30 2 * * * /mnt/d/mydata/cnphpbb/deploy.stack/hindsight/backup.job >> /var/log/hindsight-backup.log 2>&1
或参考 crontab/ 目录的统一任务管理方式(shell/up.bash 会处理 chmod +x)。
手动备份
# 热备份(推荐)
docker exec hindsight-db pg_dump -U hindsight_user -d hindsight_db | gzip > ~/hindsight/backups/manual_$(date +%Y%m%d).sql.gz
# 冷备份(停服时,更彻底)
docker compose -p hindsight -f ./hindsight/stack.yml stop
sudo rsync -a /home/geng/hindsight/pgdata/ /home/geng/hindsight/backups/pgdata-cold/
docker compose -p hindsight -f ./hindsight/stack.yml start
恢复
# 从 pg_dump 恢复
gunzip -c ~/hindsight/backups/hindsight_db_20260607_023000.sql.gz \
| docker exec -i hindsight-db psql -U hindsight_user -d hindsight_db
# 从冷备份恢复(停服 + 替换 bind 目录)
docker compose -p hindsight -f ./hindsight/stack.yml down
sudo rm -rf /home/geng/hindsight/pgdata/*
sudo rsync -a /home/geng/hindsight/backups/pgdata-cold/ /home/geng/hindsight/pgdata/
sudo chown -R 999:999 /home/geng/hindsight/pgdata
docker compose -p hindsight --env-file ./hindsight/env.cfg -f ./hindsight/stack.yml up -d
故障排查
| 症状 | 排查命令 |
|---|---|
| 容器起不来 | docker logs -f hindsight-app / docker logs -f hindsight-db |
| DB 连不上 | docker exec -it hindsight-db psql -U hindsight_user -d hindsight_db |
| 慢查询 | 在 psql 里 SELECT * FROM pg_stat_activity; |
| 端口冲突 | ss -tlnp | grep -E '8888|9999' |
| 端口未对外 | ss -tlnp 看是不是只监听 127.0.0.1,确认 ports: 没加 IP 前缀 |
| BGE 模型重下 | 容器内是否有 HF_HUB_OFFLINE=1 和 bind 挂的 HF 缓存 |
| glibc 错误 | 0.7.2 内嵌 pg0 需 glibc 2.38,方案三已用独立容器避开 |
与 Hermes 集成
Hermes plugin 通过 HTTP 调用本服务的 API(localhost:8888),不直连 DB。配置在 ~/.hermes/config.yaml:
memory:
provider: hindsight
hindsight:
api_url: http://localhost:8888
bank_id: hermes
memory_mode: hybrid
auto_recall: true
auto_retain: true
retain_async: true
切换命令:hermes config set memory.provider hindsight
相关文档
~/Obsibian/MyNotes/DevOps/04-AI工具/docs-hermes-Hindsight-记忆系统部署指南.md— 完整部署指南(700+ 行,含方案对比、旧数据迁移决策表)- 仓库根
AGENTS.md—deploy.stack项目规范 crontab/— 定时任务集成参考