在线联机原型全集：第 9 章　协作扫雷 / 限时合作解谜（Cooperative Minesweeper）

By Leeting Yan

November 5, 2025

协作扫雷 / 限时合作解谜（Cooperative Minesweeper）

类别：多人协作 + 冲突写入 + 乐观锁原型
目标：验证多人同时操作同一共享状态下的冲突解决、幂等更新、ETag 模型、协作限时与状态回放。
原型代号：proto-009-coop-minesweeper
依赖模块：proto-008-battleship, proto-005-pictionary
推荐语言栈：Go / Rust / Elixir / TypeScript
网络协议：WebSocket + HTTP (ETag 版本控制)

一、概述（Overview）

“协作扫雷” 是一种典型的多人共享棋盘类游戏，
多个玩家共同操作同一个网格世界（Grid），进行翻格、标雷、推理与协作。

不同于战舰或UNO的“玩家独立状态”，
这里的所有玩家共享一个世界状态，
且任何时刻都可能有多人同时尝试更新同一个格子。

因此本原型验证的核心能力是：

并发更新的冲突检测与解决；
幂等操作设计；
协作锁（Optimistic Lock）；
状态一致性校验；
限时任务调度与超时裁定。

二、核心玩法与系统目标（Gameplay & Objectives）

2.1 基本玩法

一张 10×10 棋盘，共 10 个雷；
玩家共同点击格子，若点中地雷则全体失败；
所有非雷格被成功翻开即胜利；
每个玩家可标记疑似地雷；
操作实时同步给所有人；
游戏设有 3 分钟时限；
倒计时结束未清空则失败。

2.2 系统目标与验证点

模块	功能目标	验证重点
并发操作控制	多人同时点击同一格	乐观锁 / 版本号
幂等性保障	重复点击不重复执行	幂等操作 ID
冲突合并	多人修改同一资源	CRDT/ETag 冲突解决
状态快照	全局状态保存	Redis Snapshot
限时机制	倒计时裁定	定时器 + 仲裁
审计日志	操作记录	时间序列回放

三、系统架构设计（Architecture）

graph TD
A[Client1] -->|action: flip_cell| B[Gateway]
A2[Client2] -->|action: flag_cell| B
B --> C[RoomService]
C --> D[GridEngine]
C --> E[ConflictResolver]
C --> F[TimerScheduler]
C --> G[AuditLogger]
D --> H[Redis Snapshot]

模块说明

模块	职责
Gateway	WebSocket 接入、鉴权、广播操作
RoomService	房间与玩家协作状态管理
GridEngine	棋盘核心逻辑与版本控制
ConflictResolver	冲突检测、合并与回滚
TimerScheduler	倒计时裁定、自动结算
AuditLogger	操作审计、回放导出
Redis Snapshot	状态快照与恢复

四、核心机制详解（Core Mechanisms）

4.1 网格状态结构（Grid Engine）

type Cell struct {
  X, Y int
  IsMine bool
  IsFlipped bool
  FlaggedBy []string
  Version int
  UpdatedAt int64
}

type Grid struct {
  Width, Height int
  Cells [][]Cell
  Version int
}

每个格子都有独立版本号（Version）；
全局 Grid 也有总体版本号（ETag）；
所有更新都必须带上客户端上次读取的版本号。

4.2 乐观锁机制（Optimistic Lock / ETag）

原理

客户端请求修改时附带上次已知版本号：

PATCH /grid/cell/5/6
If-Match: "v42"

服务器：

若当前版本号仍为 42 → 允许更新；
否则返回 412 Precondition Failed（冲突）。

客户端收到冲突后：

重新拉取最新状态；
重新计算操作；
再次尝试。

4.3 幂等操作设计（Idempotent Operations）

所有操作附带唯一操作 ID：

{
  "op_id": "uuid-2025-11-04T20:05:30",
  "action": "flip_cell",
  "x": 3,
  "y": 4
}

服务器维护去重缓存：

if op_id in processed_ops:
    return last_result
else:
    execute()

确保网络重发不会重复执行。

4.4 冲突解决策略（Conflict Resolution）

冲突类型	说明	解决策略
双方同时翻同一格	Race Condition	只接受最早到达的请求
一方翻、一方标记	意图冲突	优先执行“翻”
重复标记	冗余操作	幂等化忽略
同时多人翻多个格	状态批量合并	CRDT Merge by timestamp

4.5 定时器与裁定机制（Timer Scheduler）

功能

倒计时由服务器启动；
每秒广播剩余时间；
时间到自动触发结算；
结算逻辑：
- 若所有非雷格翻开 → 胜利；
- 若有雷被触发 / 超时 → 失败。

timer := time.NewTimer(3 * time.Minute)
<-timer.C
JudgeGame()

4.6 审计与回放系统（AuditLogger）

日志模型

[
  {"tick":1,"player":"A","op":"flip","cell":[1,1],"result":"safe"},
  {"tick":2,"player":"B","op":"flag","cell":[2,2],"result":"flagged"},
  {"tick":3,"player":"C","op":"flip","cell":[3,4],"result":"boom"}
]

回放机制

顺序重放操作；
可导出 MP4 或 GIF；
可统计“协作效率”与“冲突率”。

五、状态机（State Machine）

stateDiagram-v2
  [*] --> Ready
  Ready --> Playing: Start timer
  Playing --> Conflict: Multiple writes detected
  Conflict --> Reconcile: ConflictResolver merges
  Reconcile --> Playing
  Playing --> End: Time up or All safe
  End --> [*]

六、客户端交互流程（Flow）

sequenceDiagram
ClientA->>Server: flip_cell(x=3,y=4,version=42)
Server->>GridEngine: check version
GridEngine->>ConflictResolver: no conflict
GridEngine->>Server: update cell
Server->>AllClients: broadcast(update)
ClientB->>Server: flag_cell(x=3,y=4,version=41)
Server->>ClientB: reject 412
ClientB->>Server: refetch()

七、数据模型（Data Schema）

表	字段	描述
`grids`	id, width, height, version, state_blob	当前棋盘
`cells`	grid_id, x, y, is_mine, flipped, flagged_by	网格状态
`operations`	op_id, user_id, action, x, y, result	操作日志
`snapshots`	grid_id, version, state_json	状态快照
`audits`	grid_id, hash_chain	回放校验链

八、验证指标（Metrics & KPI）

指标	目标	说明
并发冲突率	≤5%	有效协调
平均响应时间	≤100ms	操作反馈
状态一致性	100%	全客户端相同视图
幂等命中率	100%	去重成功
超时触发率	≤1%	Timer 稳定
快照恢复成功率	≥99%	Redis 有效恢复

九、扩展功能（Extensions）

团队积分制
- 每次成功翻开非雷格加分；
- 团队成员协作加成。
错误容忍机制
- 可允许一次误雷（自动救援道具）。
回放分析
- 统计“冲突热点区域”；
- 用于协作行为分析。
AI 提示系统
- 基于当前格局自动推理安全格；
- 用于合作解谜游戏设计扩展。
CRDT 全同步模式
- 替换乐观锁为向量时间戳（Vector Clock）。

十、技术选型（Tech Stack）

层级	技术	理由
网络层	WebSocket + HTTP/ETag	双通道同步
协作层	Go + FSM	状态控制稳定
存储层	Redis + PostgreSQL	快照持久化
并发控制	乐观锁 + CRDT	冲突解决
日志层	Loki + JSONL	审计溯源
客户端	Vue / React + Canvas	棋盘渲染
回放	FFmpeg + JSONL Replay	自动生成视频

十一、压测与运维（Load & Ops）

场景	模拟行为	目标
50 名玩家同时操作	高频并发写入	冲突率 <5%
高频刷新	每秒 10 次操作	状态稳定
网络抖动	模拟 200ms 延迟	一致性保持
快照恢复	游戏中断后恢复	成功率 >99%
审计重放	重演全局日志	100% 匹配

监控指标：

operation_conflict_total
etag_mismatch_total
snapshot_restore_total
timer_expired_total
operation_idempotent_hit_total

十二、设计反思与演化（Reflection & Evolution）

12.1 核心洞察

“协作扫雷”验证了多人共享状态的核心命题：

多人写入的系统中，一致性永远不是免费的。

你必须明确选择：

是强一致（牺牲实时性）；
还是最终一致（容忍差异）。

ETag / 乐观锁是轻量化选择，
CRDT / 向量时钟是强健型选择。

12.2 技术挑战

操作冲突检测与回滚代价；
版本号同步开销；
Redis 快照体积；
审计回放的时序精度。

12.3 进化方向

能力	下一原型
任务队列 + 延迟裁定	→ #10 城格建造 mini-SLG
分布式 CRDT 共享文档	→ #11 云端协作文档
玩家协同编辑	→ #14 沙盒建造原型
异步任务执行	→ #20 时间驱动系统

十三、总结

“协作扫雷”是多人协作与并发控制的交汇点。
在这里你学会：

处理多人同时操作；
保证幂等更新；
管理冲突与版本；
保持系统可重放、可恢复。

从工程角度，这是协作类平台（如 Google Docs、Miro、Minecraft、Factorio、多人建造类游戏）的底层模型。

“前一章我们学会控制真相，这一章我们学会共享真相。”