# 用户使用与安装手册 (user-manual.md) > **本文档定位**: 给最终用户(锚点 / 项目主理 / 投委)用,**不是给工程师**。 > > 工程师装/调试见 `dev-quickstart.md`,这份只讲"装好之后怎么用"。 > > 阅读时间: 15 分钟 / 实际使用: 1-3 分钟一个议题。 > > **v3.1.1 (2026-05-27) 状态**: > - ✅ **V0 5 case 收官** (T11 strategic + T19 customer + C3 organizational + C4 product + C5 brand 全跑通) > - ✅ **`/boss <议题>` 用户面命令** (仿 `/mba` 范式, install 后在 Claude Code 内直接用) > - **部署**: 云端单租户 VM (PRD v3.1-r2 §4.1), 终端用户视角不感知 — 飞书 @ 本项目机器人或 Claude Code 输入 `/boss <议题>` 触发, 30-40 分钟后收报告 --- ## 第 1 部分系统能做什么(一句话) 把你脑子里的"一个具体议题"输入,系统在 30-40 分钟内输出一份完整判断报告, 包含**锚点视角的判断 + 6 个维度评委的独立 review + 5 镜头打分 + 反方观点 + 30/90/365 天验证清单**。 --- ## 第 2 部分我的角色 — 5 种使用场景按你的角色选场景: ### 场景 A · 锚点(决策者) — 我要做一个战略判断 ``` 1. 在飞书 @本项目机器人发: "我想判断一下 <议题>" 示例: "我想判断一下 X 业务要不要剥离" 或: "我想判断一下 Y 客户报价该不该上调 30%" 2. 等 30-40 分钟 (后台 7 评委各跑各的) 3. 飞书收到一张卡片: - 一句话主张 - 5 镜头分数 (我的视角 vs 6 维度评委) - 我的视角与维度平均的 delta (异议 / 同意度) - 30 天该验证什么 4. 我在卡片上对 5 镜头各 1-5 打分 (我同意度) 分数会回流到系统, 用于评委漂移监控 5. 30 天后自动收到 attribution check: "30 天前的判断 X, 截至今日 confirmed / falsified / pending" ``` **典型用法**: 每天 09:30 看昨天判断的 30 天 checkpoint; 每周一开始 1-2 个新议题。 --- ### 场景 B · 项目主理(业务负责) — 我要起一个新议题 ``` 1. 在 vault 中起新 case: cp -r templates/case-template/ cases/C-2026-0042/ cd cases/C-2026-0042/ vim case.json # 填 trigger_event / thesis / evidence (ATELIER 6 字段) 2. 触发判断: /boss <议题> --brand (brand-slug 是议题代号, 比如 q3-strategy-review, 用 [a-z0-9-]+) 3. 30-40 分钟后, 看 reports//report.md (主报告) + reports//report.html (可视化, 雷达图) 4. 锚点打分卡片自动推送你旁观锚点打分, 决定是否需要 EVOLUTION (再跑一轮加新材料) 5. 30/90 天 attribution 触发后, 你看 failure_cards/ 中是否有新 FC ``` **典型用法**: - 每周一起 1-2 议题 - 周五看本周 Failure Card 累积 - 每月 15 号跑 `make monthly-review-current` 看评委漂移 --- ### 场景 C · 投委(只读旁观)— 我想看本周判断质量 ``` 1. 在飞书 @本项目机器人发: "本周判断列表" 返回近 7 天 case 摘要 2. 点开任一 case 链接 → 飞书内嵌网页打开 report.html - 雷达图 (5 镜头 × 7 评委) - 反方观点 (评委的 if_thesis_wrong) - 30 天 checkpoint 进度 3. 想发表意见: 在飞书群 @决策者 + 截图 (V0 期不支持直接 in-app 投委评论, V1 加) ``` **典型用法**: 每周日晚抽 15 分钟扫一遍本周 5-10 个 case。 --- ### 场景 D · 锚点(EVOLUTION)— 我看了报告,但有新信息要补 ``` 1. 飞书 @本项目: "C-2026-0042 加新材料" 或在 CLI: /boss <议题> --refresh (EVOLUTION 模式) 2. 系统会问你: 新材料是什么? - 飞书文档 link → 自动 lark-cli 抓取 - 文本粘贴 → 直接进 cases//raw_evidence/ - 一句话补充 → 进 cases//notes.md 3. 系统会保留 v1 不动, 生成 v2: reports//versions/v1_*.md ← 不可变快照 reports//versions/v2_*.md ← 新一版 4. 飞书推送 v2 卡片, 标注 "v2: 加入了 X 材料" 你再对 v2 打分 ``` **关键**: v1 永远不会被改 — 历史快照不可变, 这是判断学的核心要求。 --- ### 场景 E · CTO(运维)— 我要看系统健康 ``` 本地终端: make filter-status # laotian 过滤器健康 make smoke # 系统冒烟 hermes status # Hermes Agent 运行状态 sage-wiki doctor # Wiki 编译引擎健康 make monthly-review-current # 月度评委漂移 + FC 统计飞书: 每天 09:00 收到自动健康卡片异常项: 飞书 PagerDuty 群 ``` --- ## 第 3 部分常用飞书指令 > 在飞书 @本项目机器人后发以下任意一条: | 指令 | 用途 | 示例 | |---|---|---| | `判断 <议题>` | 起新议题 | "判断 Y 客户报价上调" | | `查 ` | 查 case 状态 | "查 C-2026-0042" | | `本周判断` | 本周 case 列表 | "本周判断" | | `attribution ` | 看 case 的 30/90/365 天命中情况 | "attribution C-2026-0042" | | `EVOLUTION ` | 加新材料起 v2 | "EVOLUTION C-2026-0042" | | `failure cards` | 本月 FC 列表 | "failure cards" | | `健康` | 系统健康摘要 | "健康" | | `help` | 列出所有指令 | "help" | --- ## 第 4 部分飞书卡片字段解读锚点每次收到的卡片是这样: ``` ┌──────────────────────────────────────────────────────────┐ │ 📋 C-2026-0042 | v1 | example-strategy-issue │ │ │ │ 💡 一句话主张: │ │ 建议剥离 X 业务, 集中资源在 Y 上 │ │ │ │ 📊 5 镜头打分 (1-10): │ │ │ │ tian-perspective │ 6 评委均值 │ Δ delta │ │ 推理性 7.2 │ 6.5 │ +0.7 │ │ 证据-论点 6.0 │ 5.8 │ +0.2 │ │ 反方处理 5.5 │ 6.2 │ -0.7 │ │ 可证伪性 8.0 │ 7.0 │ +1.0 │ │ 现实韧性 6.5 │ 6.0 │ +0.5 │ │ ───────────────────────────────────────────── │ │ |Δ| 均值: 0.62 (健康范围 0.5-1.5) │ │ │ │ ⚠️ 反方核心担忧 (来自评委 if_thesis_wrong): │ │ 1. 行业可能处于 hype 阶段而非成熟期 (industry-trend) │ │ 2. 剥离影响品牌完整性 (strategic-vision) │ │ │ │ 🎯 30 天验证项: │ │ - X 业务月营收 < 阈值 Y → confirmed │ │ - 客户 NPS < 28 → confirmed │ │ │ │ ┌──────┬──────┬──────┬──────┬──────┐ │ │ │ ★ 1 │ ★ 2 │ ★ 3 │ ★ 4 │ ★ 5 │ ← 锚点点击打分 │ │ │ 推理 │ 证据 │ 反方 │ 可证 │ 韧性 │ │ │ └──────┴──────┴──────┴──────┴──────┘ │ │ │ │ [ EVOLUTION ] [ 标记完成 ] [ 详细 HTML ] │ └──────────────────────────────────────────────────────────┘ ``` ### 字段含义 | 字段 | 解释 | 该关注什么 | |---|---|---| | **tian-perspective** | 模拟锚点判断风格的 anchor 评委分 | 与你直觉差太多?系统对你的画像不准 | | **6 评委均值** | 6 个维度评委 (industry-trend / strategic-vision / customer-strategy / product-strategy / org-strategy / financial-strategy) 的平均 | 高 = 多维度都认同;低 = 多维度都质疑 | | **Δ delta** | 维度 - tian, 正 = 维度比你乐观,负 = 维度比你严苛 | \|Δ\|>2 = 你与维度严重分歧 → 看具体哪个评委拉大,需要补 doctrine | | **\|Δ\| 均值健康范围** | 0.5-1.5 是健康 (有适度异议) | <0.5 = 维度变应声筒;>2.0 = 维度与你脱节 | | **反方核心担忧** | 评委 frontmatter 的 `adversarial_view.if_thesis_wrong` 字段 | 看完后,如果某条让你重新思考,可以 EVOLUTION | | **30 天验证项** | 系统自动从论点反推的可证伪指标 | 30 天后系统自动检查,你不用记 | --- ## 第 5 部分安装与首次使用(给非工程师) ### 5.1 你不用自己装正常情况下,**CTO 已经在公司 prod-01 机器上装好系统**,你只需要: ``` 1. 让 CTO 把"boss 判断"机器人加你飞书 2. 学会上面的飞书指令 3. 就可以用了 ``` ### 5.2 如果你想本地试用(可选) 需要:macOS 或 Ubuntu 24,Python 3.11+,Git,飞书账号。 ```bash # 1. 拉代码 (CTO 提供 GitLab 内部地址) git clone :judgement/boss-vault.git ~/boss-vault cd ~/boss-vault # 2. 一键装 bash scripts/install.sh --skip-systemd --skip-1password # 3. 测试装好 make smoke # 应输出: ✅ smoke test 完成 # 4. (项目主理必做, 一次性) 填锚点飞书身份 cp config/laotian_filter_rules.yaml.example config/laotian_filter_rules.yaml vim config/laotian_filter_rules.yaml # 在 tian_identifiers 段填锚点的飞书 open_id # 5. 跑你的第一个议题 (CLI 版, 无需 Hermes) # (需要 Anthropic API key, 见 .env.example) export ANTHROPIC_API_KEY=sk-... python3 scripts/manual_judgement.py "我想判断的议题描述" # (此脚本 V0 期可选, 主要走飞书入口) ``` ### 5.3 本地调试的已知限制 (W0 期; code-audit 2026-05-26) > 本机直接 `git clone` 后跑 `make test-unit` / `make smoke-e2e` 都能过 (契约层), > **但下列真链路在 dev 机上跑不通,这是预期行为不是 bug**: | 缺失能力 | 原因 | 本机替代方案 | |---|---|---| | `mcp__sage-wiki__query` | sage-wiki 二进制未装,`_wiki/` 没编译 | `run_pipeline_local.py` Phase 1 grep fallback (Wiki 退化方案, 已实施) · LLM 用 `Read` 看 `anchors/tian/raw/feishu-laotian/*.md` | | `mcp__feishu__search_doc` | 没装 `op` (1Password CLI),飞书 token 没注入 | LLM 用 `WebSearch` 拉公开信息 + 手工提供截图 | | `mcp__marsdata__fetch_metric` | 同上,marsdata API key 不在 environment | 30/90/365 attribution 跑 `--dry-run`,真信号等云上 | | Hermes 自动派单 | hermes 二进制未装 | ✅ **路径 B 已落地** (W1 Day 1-3 完成, dev-plan v2.8): `python3 scripts/run_pipeline_local.py "议题" --brand [--dry-run]` Anthropic SDK 直接驱动 Phase 0-5 + Verify. 真 LLM 跑等 T11 项目主理选议题。 | | 出站 webhook 真闸 | 没有 Hermes daemon | `python3 scripts/redact_check.py --stdin --fail-close < payload.json` 手工演练 | **这些限制不影响**: 契约测试 (**173 PASS** 含 51 run_pipeline_local) / skill_lint / redact 单测 / fixture e2e / `run_pipeline_local --dry-run` 全跑通。 **这些限制影响**: 真 LLM 端到端 (W2 V0 验收目标),需要 ANTHROPIC_API_KEY 配 + 项目主理选议题。云 VM (T05a) 起来后 Hermes 可接管,但不强阻塞 V0。详见 `docs/code-audit-2026-05-26.md` §3 和 dev-plan §"风险与缓解" #3。 --- ### 5.4 我得装什么生产服务? 如果你是 CTO, 见 `dev-quickstart.md` 第 5-12 步(systemd / Hermes / sage-wiki / 1Password / 飞书 webhook 配置)。 --- ## 第 6 部分常见问题 (用户视角) ### Q1: 我提了议题,30 分钟没收到卡片 **首先检查**: - 飞书是否将"本项目机器人"加为好友?(在飞书搜"boss 判断"主动加) - 你的议题描述有没有完整三要素(触发事件 + 时间 + 干系人)? 如果都 OK, 联系 CTO 看 `~/.hermes/logs/`。 ### Q2: tian-perspective 评委给的分跟我直觉差很多这是预期的 — 系统是根据你**过去的访谈 + 飞书文档**训练的,不是实时读心。 **修复方法**: - 每月 review 中, 关注 anchor_delta 漂移信号 - 如果 |Δ| 持续 > 2, 让项目主理补 `references/research/` 加新的锚点访谈片段 ### Q3: 我对评委的某个 review 强烈不同意,怎么办 **正常**:评委的工作就是从一个特定 doctrine 视角挑刺。你不必同意每条。 **如果觉得评委系统性错了**: - 在飞书私聊项目主理 - 项目主理评估是否要修 `skills/<评委>/references/doctrine/` 加新规则,或者降权 ### Q4: 飞书机器人不响应我 3 种可能: 1. Hermes Agent 服务 down → CTO 跑 `systemctl restart hermes-agent` 2. 你不在系统的 user 白名单 → CTO 在 `.mcp.json` 中加你的飞书 user_id 3. 你的指令系统不识别 → 发 "help" 看可用指令 ### Q5: 我之前的判断历史在哪查 ``` ~/boss-vault/cases// # case 起点 ~/boss-vault/reports// # 报告 + 各版本 ~/boss-vault/_wiki/log.md # 全局历史日志 ``` 或在飞书 @本项目: "本月所有判断"。 ### Q6: 系统数据会传到 GitHub 吗? **绝对不会**。 - 所有 raw 数据 (飞书备份 / 锚点 raw 材料 / 锚点访谈 / case / 报告 / FC) 都在本地, `.gitignore` 排除 - 只有代码与设计文档可传 GitHub - 锚点飞书 user_id 在 `config/laotian_filter_rules.yaml` 中, 此文件 .gitignore 排除 - 详见 `docs/security-and-deidentification.md` ### Q7: 我换电脑了,怎么迁移? 数据在 prod-01 服务器, 不在你电脑上。你换电脑后: 1. 还是用飞书机器人, 跟之前一样 2. 不需要数据迁移如果你要在新电脑装本地 vault (场景 5.2), 重跑 `bash scripts/install.sh`。 --- ## 第 7 部分反馈与迭代 ### 7.1 我觉得某次判断质量不行 → 飞书 @项目主理 + 截图卡片 + 说"为什么不满意" 项目主理会: - 当周内分析根因 - 如果是 doctrine 缺陷 → 修 references/ - 如果是 case.json 填得不准 → 重起 v2 - 如果是评委漂移 → 写入月度 review 报告 ### 7.2 我想加一个新评委维度例:法务、合规、ESG。 → 飞书 @项目主理 + 描述新维度的判断 doctrine 项目主理会评估: - V0 期 (6 个维度) 通常够用 - V1+ 期可考虑新增评委 (工程量约 3-5 天) - 不建议超过 8 个评委 (过多评委 = 信号噪音) ### 7.3 我想停用某个评委 → 单次:在指令中加 `--panel-drop <评委名>` ``` /boss my-issue --panel-drop financial-strategy ``` → 长期:修 `panels/default.yaml` 的 `auto_judge_selection` 段(需 CTO + 项目主理 review) --- ## 第 8 部分系统能力边界 (你必须知道) | 系统不擅长 | 不擅长的原因 | 怎么办 | |---|---|---| | 你私下的、未沉淀进 vault 的想法 | 系统读不到你脑子 | EVOLUTION 时把想法补进 raw_evidence/ | | 严格量化的财务建模 | 系统是质化判断辅助, 不是 Excel | 让财务部跑模型, 再让系统判断模型假设是否成立 | | 实时市场数据(股价 / 汇率) | sage-wiki + marsdata 有日级延迟 | 不要让系统做 "今天股价" 类问题 | | 法律咨询 | 没有法务评委(V0) | 用其他法律专业工具,系统判断"是否要找法务" | | 极度专业的技术细节(芯片设计 / 生物医药) | 评委是商业判断 doctrine,不是技术专家 | 系统判断 "战略层面",技术细节找专家 | | 你与某个人的情感问题 | 没在判断学范畴 | 找朋友 | --- ## 第 9 部分紧急联系 | 情况 | 联系 | |---|---| | 飞书机器人无响应 | CTO (飞书私聊) | | 我误删了某 case | CTO (从 git / 备份恢复) | | 我看到不应该出现的内容 | 立即 CTO + 锚点, 走 §incident response (见 security-and-deidentification.md §7) | | 我想加新功能 | 项目主理 (评估后排进 V1+ 路线) | | 我对某次判断完全不同意 | 项目主理 + 提供具体不满意原因 | --- > 本文档与 `dev-quickstart.md` (工程师视角) / `security-and-deidentification.md` (安全 SOP) 互补。 > 修订需项目主理 + 锚点 review。