prd-v3.1.md §4.1| 工作负载 | CPU 平均 | CPU 峰值 | RAM 平均 | RAM 峰值 | 说明 |
|---|---|---|---|---|---|
| sage-wiki compile (Karpathy) | 0.5 vCPU | 3-4 vCPU | 1 GB | 6-8 GB | 全量 169+ 文件 ingest 时峰值,30 min 一次,后续增量轻 |
| Hermes daemon (always-on) | 0.2 vCPU | 1 vCPU | 0.5 GB | 1.5 GB | Python + skills 加载,大部分时间在 idle 等 webhook |
| Phase 2 sub-agents (5 并行) | 0.2 vCPU | 1-2 vCPU | 0.3 GB | 1 GB | 主要等 LLM API 响应, CPU/RAM 都低, 持续 3-5 min |
| attribution scheduler (daily cron) | ~0 vCPU | 0.1 vCPU | ~0 GB | 0.1 GB | 每天 09:00 跑一次, 几秒钟扫完所有 case |
| laotian filter (rsync 触发) | ~0 vCPU | 0.5 vCPU | ~0 GB | 0.3 GB | 10,794 条扫 1.76s (实测), 不常驻 |
| 飞书 webhook receiver (T17 后) | ~0 vCPU | 0.1 vCPU | 0.1 GB | 0.2 GB | HTTP server, 几乎全 idle |
| OS + 工具 (Ubuntu 24 + Python) | 0.3 vCPU | 0.5 vCPU | 0.5 GB | 1 GB | systemd + journald + ssh + 监控 agent |
| 合计 (V0) | ~1.2 vCPU | 4-6 vCPU | 2.4 GB | 8-12 GB | 峰值同时发生概率低, 仍按上限规划 |
| 安全裕度建议 | +1 vCPU | — | +2 GB | — | 留 +25% 余量应对突发, sage-wiki 编译期 OOM 风险 |
8 GB 紧但能跑,
16 GB 是黄金 spec。若选 8 GB, sage-wiki 全量 compile 时建议 cron
凌晨 04:00 跑 (low traffic 时段),并配 8 GB swap 兜底 OOM。
| 项 | V0 (本月) | V1 (~6 月) | V2+ (~12 月) | 说明 |
|---|---|---|---|---|
| vault repo (git clone) | ~2 GB | ~3 GB | ~5 GB | 含 docs/ tests/ scripts/ 等;不含 backups/feishu/ (留本地 Mac) |
| anchors/tian/raw/feishu-laotian/ (T07b sync) | 200 MB | ~1 GB | ~3 GB | 169 + 后续过滤产物, ST/EMT 例会等 |
| _wiki/ (sage-wiki compile) | ~500 MB | ~2 GB | ~5 GB | entities/people/concepts/summaries 索引 |
| cases/ + reports/ + versions/ | ~50 MB | ~500 MB | ~3 GB | 每 case ~50 KB,V1 期 100 case,V2 期累计含历史 versions |
| failure_cards/ + attribution logs | ~10 MB | ~100 MB | ~500 MB | 30/90/365 attribution 日志 + Failure Card |
| swap (RAM 不够时兜底) | 8 GB | 8 GB | 16 GB | sage-wiki 编译 OOM 防护;8 GB VM 必备 |
| 系统 + Python deps + 日志 | ~10 GB | ~15 GB | ~20 GB | Ubuntu 24 + Python pkg + journald + 监控 |
| 合计 (推荐磁盘) | 40-50 GB | 50-80 GB | 80-120 GB | 50 GB SSD 起步, V1 末看是否升 100 GB |
| 方向 | 类型 | 单次 | 频次 | 月流量 |
|---|---|---|---|---|
| ↑ 出口 | Anthropic API (LLM) | ~50 KB/req | ~3000 req/月 (60 议题 × 50 调用) | ~150 MB |
| ↑ 出口 | 飞书 OpenAPI (webhook 回调) | ~5 KB/msg | ~500 msg/月 | ~3 MB |
| ↓ 入口 | git pull (T24 cron, 5 min/次) | ~1 MB delta | ~8000 次/月 | ~50 MB (多数 304) |
| ↓ 入口 | rsync laotian (T07b) | ~100 MB/次 | ~30 次/月 | ~3 GB |
| ↑↓ 双向 | SSH 运维 + 监控 | ~10 KB | 常连 | ~100 MB |
| 月流量合计 (V0) | ~3.5 GB / 月 · 1.5 TB 套餐绰绰有余 | |||
| 实例 | 档 | 配置 | 月费 (¥) | 节点 | 优势 | 劣势 |
|---|---|---|---|---|---|---|
| 腾讯云轻量 | Minimal | 2C4G 60GB · 1.2TB/月 | ¥38 | 香港 / 上海 | 性价比最高 · 国内备案易 | 4G 跑 sage-wiki 编译会 OOM |
| 腾讯云轻量 | Rec | 4C8G 80GB · 1.5TB/月 | ¥88 | 香港 / 上海 | V0 最佳性价比 · 香港兼顾飞书 + Anthropic | 香港 IP 偶尔被滥用拉黑 · 套餐型不灵活 |
| 腾讯云轻量 | Headroom | 4C16G 100GB · 2TB/月 | ¥180 | 香港 / 上海 | V1 长期 · 升级平滑 | 同档比 CVM 略贵 · 备案改造需迁 CVM |
| 阿里云 ECS · c7a.large | Minimal | 2C4G 40GB SSD | ¥130 | 杭州 / 香港 | 企业 SLA 99.975% | 磁盘小 · 4G RAM 偏紧 |
| 阿里云 ECS · c7a.xlarge | Rec | 4C8G 80GB SSD | ¥250 | 杭州 / 香港 | 企业级稳定 · 国内带宽 + 内网 RDS 友好 | 比腾讯轻量贵 3x · 流量另算 (~¥0.8/GB) |
| 阿里云 ECS · g7a.xlarge | Headroom | 4C16G 100GB SSD | ¥420 | 杭州 / 香港 | 16G RAM + ECS 灵活 · 企业方案首选 | 价格高 · V0 期 overkill |
| Hetzner CX22 | Minimal | 2C4G 40GB NVMe · 20TB/月 | ¥36 (€4.59) | 德国 / 芬兰 | 价格屠夫 · NVMe + 20 TB 流量 | 跨境 RTT 200ms+ · 偶尔丢包 |
| Hetzner CX32 | Rec | 4C8G 80GB NVMe · 20TB/月 | ¥66 (€8.46) | 德国 / 芬兰 | 价格仅 1/3 国内 · 8G spec 跑得动 | 需自配 V2Ray/Wireguard 转 Anthropic · 飞书 webhook 跨境 |
| Hetzner CX42 | Headroom | 8C16G 160GB NVMe · 20TB/月 | ¥138 (€17.62) | 德国 / 芬兰 | 8 核 16G 仅 ¥138/月, 半价 V1+ 长期 | 同上跨境问题 · 法律: GDPR 但飞书数据存欧洲合规需评估 |
| 因素 | 权重 | 腾讯云轻量 (香港 4C8G) |
阿里云 ECS (杭州 4C8G) |
Hetzner CX32 (德国 4C8G) |
|---|---|---|---|---|
| 1. 月预算 (越便宜越高分) | 25% | 4 / 5 ¥88 |
2 / 5 ¥250 |
5 / 5 ¥66 |
| 2. 飞书 OpenAPI 延迟 | 20% | 4 / 5 ~30 ms |
5 / 5 ~10 ms |
2 / 5 ~200 ms |
| 3. Anthropic API 延迟 + 稳定 | 20% | 4 / 5 ~100 ms · 稳 |
2 / 5 跨境抖动 · 需代理 |
5 / 5 ~80 ms · 稳 |
| 4. 备案 / 合规 / 法律 | 15% | 5 / 5 香港不备案 |
4 / 5 需备案 (域名) |
3 / 5 GDPR · 跨境合规需评估 |
| 5. 运维复杂度 | 10% | 5 / 5 套餐型最简单 |
4 / 5 ECS 灵活但配置项多 |
3 / 5 需自配 V2Ray + 防火墙 |
| 6. SLA + 客服 | 10% | 3 / 5 99.9% · 工单 24h |
5 / 5 99.975% · 企业客服 |
3 / 5 99.9% · 英文工单 |
| 加权总分 (满分 5.0) | 4.20 | 3.30 | 3.90 | |
| 推荐场景 | ★ V0 默认 | 企业 SLA 强需求时 | V1+ 预算紧 | |
# 1. 控制台买实例 (~5 min) # 选 "AI 推理" 镜像或 Ubuntu 24 LTS # 地域: 香港 · 套餐: 4C8G 80GB 1.5TB # 2. SSH 上去, 改默认 user ssh root@<public_ip> adduser boss usermod -aG sudo boss mkdir /home/boss/.ssh <粘贴 Mac 的 id_ed25519.pub> # 3. 关 root login + 改 SSH 端口 sed -i 's/PermitRootLogin yes/PermitRootLogin no/' \ /etc/ssh/sshd_config # Port 22 → 22422 # 4. 防火墙白名单 ufw allow 22422/tcp ufw allow 443/tcp # 飞书 webhook ufw enable # 5. apt + Python apt update && apt install -y \ python3.10 python3-pip git \ fail2ban htop rsync # 6. swap 8 GB (sage-wiki 兜底) fallocate -l 8G /swapfile chmod 600 /swapfile mkswap /swapfile && swapon /swapfile # 7. clone vault (用 deploy key) ssh-keygen -t ed25519 -f \ /home/boss/.ssh/github_deploy # 把 pub key 加到 GitHub repo deploy keys git clone git@github.com:zhanglunet/boss-vault.git cd boss-vault && make install
# 1. 控制台买 ECS c7a.xlarge # Ubuntu 24 LTS, 80GB SSD # 可选: 加 NAS / OSS 备份 # 2. ssh + 改 user (同腾讯) ssh root@<public_ip> # 后续步骤同腾讯 # 3. 备案 (如绑了域名) # 阿里云控制台 → 备案中心 # 域名指向 ECS 公网 IP # 审核期 1-3 周 # 4. 关键: 配 NAT 网关或代理转 Anthropic API # 国内 ECS 直连 anthropic.com 不稳 # 方案 A: 香港 NAT 网关 # 方案 B: 自架 V2Ray over 443 # 方案 C: 用 OpenAI 代理服务 # 5. RAM 加密 (敏感判断) apt install cryptsetup # 给 cases/ + failure_cards/ 单独挂加密分区 # 6. 监控接入 # 阿里云 CMS agent 自带, 装即可 wget <cms-agent-url> && bash install.sh # 7. clone + make install (同腾讯)
# 1. console.hetzner.cloud 买 CX32 # 选 Ubuntu 24 LTS · Falkenstein # 免费送 IPv4 + IPv6 # 2. SSH 上去 (root 默认开) ssh root@<ipv4> # 改 user + 关 root + 防火墙 (同腾讯) # 3. 跨境网络优化 # Anthropic 直连 < 100 ms · 飞书需代理 # 方案: 自架 V2Ray + reality 协议 apt install -y golang # 装 V2Ray 转飞书 OpenAPI # 4. 时区 (Hetzner 默认 UTC) timedatectl set-timezone Asia/Shanghai # 5. swap 同腾讯, NVMe 速度更快 # 6. 备份: hetzner snapshot ¥3.5/月 # 控制台开自动周快照 # 7. GDPR 合规: 数据是否能存欧洲? # 锚点材料可能算个人信息, 需评估 # 若不可: 不要选 Hetzner # 8. clone + make install (同腾讯)
make install 跑通。
此 7 项过了 → T05a DONE,T05 / T07b / T24 可继续。
本周决策 (周五 2026-05-29 截止):
本周后续动作 (T05a 解锁后):
累计 W1 期工作量约 3-4 天 CTO 时间 · 完成后 T13-14 第一个 FRESH 真议题就能跑。