云服务方案 · boss-vault 上云规格

T05a 决策材料 · 资源需求计算 + 9 实例对比 + 推荐路径 · 配套 prd-v3.1.md §4.1
编制 · 2026-05-26
对接 · CTO + 项目主理
触发 · dev-plan v2.7 T05a
价格基准 · 2026 H1 市场价

推荐 V0: 腾讯云轻量应用服务器 · 4C8G · 香港节点

4 vCPU · 8 GB RAM · 80 GB SSD · 1.5 TB/月流量 · 香港 (兼顾 Anthropic API + 飞书 OpenAPI) · Ubuntu 24 LTS。 年付 ¥75/月, 月付 ¥88/月。W4 V0 验收后视使用强度可平滑升 4C16G。
¥88
月付 / Hong Kong 节点

SECTION 1 资源需求计算 按工作负载分解 + 峰值 + 安全裕度

工作负载 CPU 平均 CPU 峰值 RAM 平均 RAM 峰值 说明
sage-wiki compile (Karpathy) 0.5 vCPU 3-4 vCPU 1 GB 6-8 GB 全量 169+ 文件 ingest 时峰值,30 min 一次,后续增量轻
Hermes daemon (always-on) 0.2 vCPU 1 vCPU 0.5 GB 1.5 GB Python + skills 加载,大部分时间在 idle 等 webhook
Phase 2 sub-agents (5 并行) 0.2 vCPU 1-2 vCPU 0.3 GB 1 GB 主要等 LLM API 响应, CPU/RAM 都低, 持续 3-5 min
attribution scheduler (daily cron) ~0 vCPU 0.1 vCPU ~0 GB 0.1 GB 每天 09:00 跑一次, 几秒钟扫完所有 case
laotian filter (rsync 触发) ~0 vCPU 0.5 vCPU ~0 GB 0.3 GB 10,794 条扫 1.76s (实测), 不常驻
飞书 webhook receiver (T17 后) ~0 vCPU 0.1 vCPU 0.1 GB 0.2 GB HTTP server, 几乎全 idle
OS + 工具 (Ubuntu 24 + Python) 0.3 vCPU 0.5 vCPU 0.5 GB 1 GB systemd + journald + ssh + 监控 agent
合计 (V0) ~1.2 vCPU 4-6 vCPU 2.4 GB 8-12 GB 峰值同时发生概率低, 仍按上限规划
安全裕度建议 +1 vCPU +2 GB 留 +25% 余量应对突发, sage-wiki 编译期 OOM 风险

峰值 RAM 分解 (6-8 GB 用在哪)

8 GB VM 峰值
sage-wiki 6 GB
Hermes 1.5 GB
OS 0.5 GB
8 GB (紧)
16 GB VM 峰值
sage-wiki 8 GB
Hermes 2 GB
OS 1 GB
余量 5 GB
16 GB (稳)
日常 idle
sage 1 GB
H 0.5
OS 0.5
空闲 6 GB
8 GB ok
sage-wiki 编译
Hermes + Skills
OS + 工具
余量 (headroom)
关键判断: V0 期 8 GB 紧但能跑, 16 GB 是黄金 spec。若选 8 GB, sage-wiki 全量 compile 时建议 cron 凌晨 04:00 跑 (low traffic 时段),并配 8 GB swap 兜底 OOM。

SECTION 2 磁盘 + 带宽 + 节点位置

V0 (本月) V1 (~6 月) V2+ (~12 月) 说明
vault repo (git clone) ~2 GB ~3 GB ~5 GB 含 docs/ tests/ scripts/ 等;不含 backups/feishu/ (留本地 Mac)
anchors/tian/raw/feishu-laotian/ (T07b sync) 200 MB ~1 GB ~3 GB 169 + 后续过滤产物, ST/EMT 例会等
_wiki/ (sage-wiki compile) ~500 MB ~2 GB ~5 GB entities/people/concepts/summaries 索引
cases/ + reports/ + versions/ ~50 MB ~500 MB ~3 GB 每 case ~50 KB,V1 期 100 case,V2 期累计含历史 versions
failure_cards/ + attribution logs ~10 MB ~100 MB ~500 MB 30/90/365 attribution 日志 + Failure Card
swap (RAM 不够时兜底) 8 GB 8 GB 16 GB sage-wiki 编译 OOM 防护;8 GB VM 必备
系统 + Python deps + 日志 ~10 GB ~15 GB ~20 GB Ubuntu 24 + Python pkg + journald + 监控
合计 (推荐磁盘) 40-50 GB 50-80 GB 80-120 GB 50 GB SSD 起步, V1 末看是否升 100 GB

带宽 (月出口估算)

方向 类型 单次 频次 月流量
↑ 出口 Anthropic API (LLM) ~50 KB/req ~3000 req/月 (60 议题 × 50 调用) ~150 MB
↑ 出口 飞书 OpenAPI (webhook 回调) ~5 KB/msg ~500 msg/月 ~3 MB
↓ 入口 git pull (T24 cron, 5 min/次) ~1 MB delta ~8000 次/月 ~50 MB (多数 304)
↓ 入口 rsync laotian (T07b) ~100 MB/次 ~30 次/月 ~3 GB
↑↓ 双向 SSH 运维 + 监控 ~10 KB 常连 ~100 MB
月流量合计 (V0) ~3.5 GB / 月 · 1.5 TB 套餐绰绰有余
节点位置关键: Anthropic API 在美西, 飞书 OpenAPI 在中国内地。
· 香港节点: 两边 RTT ~100ms, 网络稳, V0 推荐
· 东京节点: 直连 Anthropic <50ms 最优, 飞书 80ms 可接受
· 上海/杭州节点: 飞书 <20ms 优, Anthropic 需走代理或加速 (200ms+ 跨境抖动)
· 德国 (Hetzner): 双边 200ms+, 适合 V1+ 不依赖飞书的纯研究场景

SECTION 3 三档配置 · Minimal / Recommended / Headroom

Minimal · 起步档
V0 准备期试水 (本月-W2)
2 vCPU · 4 GB RAM · 40 GB SSD
月费区间: ¥40-60

- sage-wiki 全量 compile 时
  有 OOM 风险, 必须 8 GB swap
- 同时 5 sub-agents + 编译会卡
- 仅适合验证部署链路
- 不推荐用于真议题
Headroom · 长期档
V1 上线后 (W12+)
4 vCPU · 16 GB RAM · 100 GB SSD
月费区间: ¥160-280

- sage-wiki 编译留 5 GB 余量
- 30/90/365 attribution 同时跑
- 多议题 (3+) 并行不卡
- 长期归档 + 历史 versions
- V2 PRD 冻结后 标配

SECTION 4 云服务商对比 · 3 服务商 × 3 档位

实例 配置 月费 (¥) 节点 优势 劣势
腾讯云轻量 Minimal 2C4G 60GB · 1.2TB/月 ¥38 香港 / 上海 性价比最高 · 国内备案易 4G 跑 sage-wiki 编译会 OOM
腾讯云轻量 Headroom 4C16G 100GB · 2TB/月 ¥180 香港 / 上海 V1 长期 · 升级平滑 同档比 CVM 略贵 · 备案改造需迁 CVM
阿里云 ECS · c7a.large Minimal 2C4G 40GB SSD ¥130 杭州 / 香港 企业 SLA 99.975% 磁盘小 · 4G RAM 偏紧
阿里云 ECS · c7a.xlarge Rec 4C8G 80GB SSD ¥250 杭州 / 香港 企业级稳定 · 国内带宽 + 内网 RDS 友好 比腾讯轻量贵 3x · 流量另算 (~¥0.8/GB)
阿里云 ECS · g7a.xlarge Headroom 4C16G 100GB SSD ¥420 杭州 / 香港 16G RAM + ECS 灵活 · 企业方案首选 价格高 · V0 期 overkill
Hetzner CX22 Minimal 2C4G 40GB NVMe · 20TB/月 ¥36 (€4.59) 德国 / 芬兰 价格屠夫 · NVMe + 20 TB 流量 跨境 RTT 200ms+ · 偶尔丢包
Hetzner CX32 Rec 4C8G 80GB NVMe · 20TB/月 ¥66 (€8.46) 德国 / 芬兰 价格仅 1/3 国内 · 8G spec 跑得动 需自配 V2Ray/Wireguard 转 Anthropic · 飞书 webhook 跨境
Hetzner CX42 Headroom 8C16G 160GB NVMe · 20TB/月 ¥138 (€17.62) 德国 / 芬兰 8 核 16G 仅 ¥138/月, 半价 V1+ 长期 同上跨境问题 · 法律: GDPR 但飞书数据存欧洲合规需评估
价格说明: 价格按 2026 H1 公开月付报价, 不含年付折扣 (年付通常 -15%~-25%)。 汇率 €1 ≈ ¥7.85。流量套餐外按 ¥0.5-1/GB 计。 真实采购前请到各厂商控制台核实当前优惠。

SECTION 5 决策因素矩阵 · 5 维 heatmap

因素 权重 腾讯云轻量
(香港 4C8G)
阿里云 ECS
(杭州 4C8G)
Hetzner CX32
(德国 4C8G)
1. 月预算 (越便宜越高分) 25% 4 / 5
¥88
2 / 5
¥250
5 / 5
¥66
2. 飞书 OpenAPI 延迟 20% 4 / 5
~30 ms
5 / 5
~10 ms
2 / 5
~200 ms
3. Anthropic API 延迟 + 稳定 20% 4 / 5
~100 ms · 稳
2 / 5
跨境抖动 · 需代理
5 / 5
~80 ms · 稳
4. 备案 / 合规 / 法律 15% 5 / 5
香港不备案
4 / 5
需备案 (域名)
3 / 5
GDPR · 跨境合规需评估
5. 运维复杂度 10% 5 / 5
套餐型最简单
4 / 5
ECS 灵活但配置项多
3 / 5
需自配 V2Ray + 防火墙
6. SLA + 客服 10% 3 / 5
99.9% · 工单 24h
5 / 5
99.975% · 企业客服
3 / 5
99.9% · 英文工单
加权总分 (满分 5.0) 4.20 3.30 3.90
推荐场景 ★ V0 默认 企业 SLA 强需求时 V1+ 预算紧
评分依据: 5 = 业内最佳 / 4 = 优秀 / 3 = 合格 / 2 = 勉强 / 1 = 不可接受。 权重按 V0 期重要性排:预算 + 双 API 延迟占 65%,合规 + 运维 + SLA 占 35%。 Hetzner 高分卡在飞书延迟(权重 20%)单项失分。

SECTION 6 推荐路径 · V0 → V1 → V2 演进

PHASE V0 · 本月-W4
2026-05-27 → 2026-06-30 · 约 5 周
腾讯云轻量 4C8G HK
¥88/月 · 香港节点。8 GB RAM 配 8 GB swap 兜底 sage-wiki 编译。 1.5 TB 月流量绰绰有余 (实际 ~3.5 GB)。

首选理由: V0 验收 7 项指标全部能在此规格上跑。
年付 ¥75/月可省 ¥156, 但建议先 1 月 trial 验证再年付。
PHASE V1 · ~ 06-30 → 09-30
W4 V0 验收后 ~ 3 个月
视使用强度: 维持 4C8G 或升 4C16G
看 V0 期 5 个 case 的 RAM / CPU 使用峰值。

- 若 sage-wiki 编译没触发 swap → 维持 4C8G ¥88
- 若 OOM 触发过 1 次以上 → 升 4C16G ¥180/月
- 若 attribution 30/90/365 + 多议题并行卡 → 升 Headroom 档
PHASE V2+ · 2026-12+
PRD v3.1 final 冻结 + EvoMap 解冻
迁 ECS / Hetzner 长期
V2+ 公开化判断 + 多机器人接入, 流量与稳定性要求升级。

- 公开发布层 → Hetzner CX42 8C16G ¥138/月 (流量大优势)
- 内部敏感判断层 → 阿里云 ECS 内网隔离 + RAM 加密 ¥250+
- 分层架构: 内/外分机, 内层只暴露给授权账号

SECTION 7 初始化命令片段 各服务商前 30 分钟

腾讯云轻量 (香港)

# 1. 控制台买实例 (~5 min)
#    选 "AI 推理" 镜像或 Ubuntu 24 LTS
#    地域: 香港 · 套餐: 4C8G 80GB 1.5TB

# 2. SSH 上去, 改默认 user
ssh root@<public_ip>
adduser boss
usermod -aG sudo boss
mkdir /home/boss/.ssh
<粘贴 Mac 的 id_ed25519.pub>

# 3. 关 root login + 改 SSH 端口
sed -i 's/PermitRootLogin yes/PermitRootLogin no/' \
  /etc/ssh/sshd_config
# Port 22 → 22422

# 4. 防火墙白名单
ufw allow 22422/tcp
ufw allow 443/tcp # 飞书 webhook
ufw enable

# 5. apt + Python
apt update && apt install -y \
  python3.10 python3-pip git \
  fail2ban htop rsync

# 6. swap 8 GB (sage-wiki 兜底)
fallocate -l 8G /swapfile
chmod 600 /swapfile
mkswap /swapfile && swapon /swapfile

# 7. clone vault (用 deploy key)
ssh-keygen -t ed25519 -f \
  /home/boss/.ssh/github_deploy
# 把 pub key 加到 GitHub repo deploy keys
git clone git@github.com:zhanglunet/boss-vault.git
cd boss-vault && make install

阿里云 ECS (杭州)

# 1. 控制台买 ECS c7a.xlarge
#    Ubuntu 24 LTS, 80GB SSD
#    可选: 加 NAS / OSS 备份

# 2. ssh + 改 user (同腾讯)
ssh root@<public_ip>
# 后续步骤同腾讯

# 3. 备案 (如绑了域名)
#    阿里云控制台 → 备案中心
#    域名指向 ECS 公网 IP
#    审核期 1-3 周

# 4. 关键: 配 NAT 网关或代理转 Anthropic API
#    国内 ECS 直连 anthropic.com 不稳
#    方案 A: 香港 NAT 网关
#    方案 B: 自架 V2Ray over 443
#    方案 C: 用 OpenAI 代理服务

# 5. RAM 加密 (敏感判断)
apt install cryptsetup
# 给 cases/ + failure_cards/ 单独挂加密分区

# 6. 监控接入
# 阿里云 CMS agent 自带, 装即可
wget <cms-agent-url> && bash install.sh

# 7. clone + make install (同腾讯)

Hetzner CX32 (德国)

# 1. console.hetzner.cloud 买 CX32
#    选 Ubuntu 24 LTS · Falkenstein
#    免费送 IPv4 + IPv6

# 2. SSH 上去 (root 默认开)
ssh root@<ipv4>
# 改 user + 关 root + 防火墙 (同腾讯)

# 3. 跨境网络优化
# Anthropic 直连 < 100 ms · 飞书需代理
# 方案: 自架 V2Ray + reality 协议
apt install -y golang
# 装 V2Ray 转飞书 OpenAPI

# 4. 时区 (Hetzner 默认 UTC)
timedatectl set-timezone Asia/Shanghai

# 5. swap 同腾讯, NVMe 速度更快

# 6. 备份: hetzner snapshot ¥3.5/月
#    控制台开自动周快照

# 7. GDPR 合规: 数据是否能存欧洲?
#    锚点材料可能算个人信息, 需评估
#    若不可: 不要选 Hetzner

# 8. clone + make install (同腾讯)
共通强制项 (T05a 验收清单): ① 仅密钥 SSH 登录 (禁密码) · ② SSH 非默认端口 · ③ fail2ban 装好 · ④ 防火墙白名单 Mac 出口 IP + 飞书 webhook 范围 · ⑤ deploy key 配 GitHub (T24 git pull 用) · ⑥ swap 8 GB · ⑦ make install 跑通。 此 7 项过了 → T05a DONE,T05 / T07b / T24 可继续。

SECTION 8 最终建议 · 给 CTO 拍板

本周决策 (周五 2026-05-29 截止):

  1. 购腾讯云轻量 4C8G 香港 1 月 trial · ¥88
    理由: 加权评分最高 (4.20/5),覆盖 V0 全部需求,首月不年付留试错空间。
  2. 预算批准月度 ¥100 上限
    含 VM 88 + 监控/备份 ~10。Anthropic API 费用另列 (V0 期估 ¥200/月)。
  3. 申请 1 个固定公网 IP
    飞书 webhook 需稳定回调地址。轻量自带, 无需额外。
  4. 跳过: 阿里云 ECS (vs 腾讯 3x 贵, V0 期 SLA 优势用不上) · Hetzner (跨境飞书延迟卡 V0 议题节奏)
  5. W4 验收后重评: 看实际 RAM/CPU 峰值,决定是否升 4C16G 或迁 ECS

本周后续动作 (T05a 解锁后):

  • T05 sage-wiki 装在云 VM (1 天)
  • T07b cloud_sync.sh 实战 (本地 Mac → 云) (半天)
  • T09 Hermes daemon 部署 (半天)
  • T26 出站闸真测 (mock 飞书 webhook 含真名, 看是否拦截) (1 小时)
  • T24 git_sync_cron.sh 上 cron (1 小时)
  • T25 1Password 配 op item (boss-vault-env / boss-laotian-rules) (1 小时)

累计 W1 期工作量约 3-4 天 CTO 时间 · 完成后 T13-14 第一个 FRESH 真议题就能跑。