RPC 巡检 Skill 提速优化

0x01 背景

一次标准的"服务健康巡检"执行链路包含 9 个 Phase、~57 次工具调用、端到端耗时 ~38-42s。其中存在大量可消除的假等待、重复进程启动、不必要的串行阻塞和可避免的失败重试。

通过对 4 个维度（Skill 文档结构、数据查询管道、脚本/MCP 交互、工作流编排）的系统审查，识别出以下核心瓶颈：

工作流假等待：Phase 6（时间对比）可通过 --offset 合入 Phase 3 直接消除；Phase 5/7/8 仅依赖 Phase 4 决策可全部并行
脚本重复启动：6 次 fetch_red_summary.py 独立调用（6 次 Python 启动 + 6 次 MCP 连接），固定开销 ~2.4s
告警查询需手写脚本：每次 7+ 次工具调用，且服务器名不一致导致首次调用必然失败
前置文档过度读取：强制全量前置读取 ~1,511 行文档，实际利用率 ~43%

分 4 层实施，按投入产出比排序：

L1 快赢（SKILL.md 改写，零代码改动）

L2 脚本改进（改 3 个脚本文件）

L3 文档精简（合并/拆分文档）

优化点	方案	预期节省
合并格式文件	`common_format.md` + `output_format.md` → `standard_format.md`	1 次 Read
指标协议内联	高频字段摘要内联到 SKILL.md	1 次 Read
use_red_summary 拆分	核心 API 140 行 + recipes 176 行	前置读取 -56%

L4 长期架构（stdout 协议 + 编排重构）

优化点	方案	预期节省
stdout 摘要直出	小结果直接 stdout，大数据走文件	~10 次 Read
Phase 并行编排重构	全面重写 0x04 工作流描述	~5s