Hermes + Tailscale FleetOps:跨 Windows/Linux/macOS 的远程宕机现场分析架构

远程机器最小操作:执行一条 bootstrap 脚本,自动安装 Tailscale、启用 SSH、创建受限 hermesops 账号、部署诊断脚本。本地 Hermes 控制节点通过 Tailnet/MagicDNS/SSH 指挥远端采集证据并分析。

本地 Hermes 控制节点 Tailscale Tailnet / WireGuard 私网 远程现场机器池 Hermes Agent CLI/Gatewayterminal + file + session_search用户:分析 host-X 宕机原因 FleetOps Wrapperssh/scp/tailscale status 自动化~/.hermes/fleet/hosts.yaml 证据库 / Case Storejournal/eventlog/dmesg/sysdiagnoseSMART/MCE/WHEA/IPMI/thermaltimeline + root-cause report Tailnet ControlMagicDNS / ACL / Tags短期 auth key 最小权限control → tag:incident:22禁止远端访问控制节点SSH key + sudo 白名单 NAT 穿透P2P WireGuard 优先DERP fallback Linux / NAS / VMtailscaled + sshd + hermesops/opt/hermes-remote/diagnose.sh macOSTailscale.app/brew + Remote Loginpanic logs / unified logs / sysdiagnose Windows 10/11/ServerTailscale MSI + OpenSSH ServerC:\ProgramData\HermesRemote\diagnose.ps1EventLog / WHEA / BugCheck 一条命令 Bootstrap复制粘贴即可进入可诊断资产池 绿色=SSH 命令;灰色=身份/路由/ACL;粉色虚线=证据包回传。Hermes 不暴露公网,远端不存 LLM key。核心原则:控制面集中在本地;数据面远端仅保留最小远控与诊断能力;结束后可吊销设备/账号/密钥。
控制面

本地 Hermes 保存模型密钥、会话、分析能力;仅通过 SSH over Tailscale 对远端运行诊断。

远端最小化

远端只装 Tailscale、SSH、受限账号、诊断脚本;不装 Hermes,不开公网端口。

安全边界

ACL + SSH key + sudo 白名单 + 证据包本地分析;任务结束可撤销设备。