Game

游戏服务器人机对局隔离架构：让机器人参与但不污染真实生态

拆解新手保护、低峰补位、训练模式中的机器人对局架构，重点讨论匹配隔离、战斗服标记、奖励限制、数据统计和风控边界，避免机器人对真实排行榜和经济系统造成污染。

Leeting Yan 2021-04-18 11 分钟阅读 5331 字

问题背景

机器人对局是很多游戏改善新手体验和低峰匹配的手段，但它也很容易污染真实生态。玩家刷机器人上分、任务进度被机器人对局快速完成、经济产出被训练模式放大、数据分析把机器人胜率当成真实玩家表现，这些问题都不是 AI 聪不聪明导致的，而是架构没有把人机对局标识贯穿到底。

机器人可以进入战斗，但不能像普通玩家一样进入所有系统。匹配、战斗、结算、任务、排行、数据仓库都要知道本局是否包含机器人、机器人占比多少、对局目的是什么。

这篇文章不讨论某个具体商业项目的私有实现，而是把我在设计类似系统时会坚持的边界、数据模型、失败处理和排查手段整理出来。你可以把它当作一份架构评审前的检查清单：如果一个方案回答不了这些问题，上线后大概率会在并发、灰度、客服申诉或数据分析里付出成本。

架构总览

flowchart LR
  Match["匹配服务"] --> Policy["机器人补位策略"]
  Policy --> Room["创建对局上下文"]
  Room --> Battle["战斗服"]
  Battle --> Result["结算服务"]
  Result --> Reward["奖励限制"]
  Result --> Rank["排行过滤"]
  Result --> Analytics["数据标记"]
  BotPool[("机器人池")] --> Policy

这张图只画主链路。实际落地时，旁路通常还包括配置发布、灰度实验、审计归档、风控抽样和客服查询。主链路越清楚，旁路越容易补齐；主链路如果已经把状态揉在一起，后面所有“临时需求”都会变成直接改库或复制逻辑。

1. 先定义人机对局类型

不是所有机器人对局都一样。新手引导局、训练局、低峰补位局、断线托管、压力测试机器人，目的和限制完全不同。对局上下文里应该有 match_composition：human_count、bot_count、bot_reason、is_ranked_eligible、reward_policy。不要只用 has_bot 一个布尔值，因为低峰补位可能允许少量排行积分，而训练局则完全不进排行。

在工程实现上，我会要求这一层有明确的输入、输出和错误码。输入不要偷偷依赖调用方的内存状态，输出也不要只给一个成功失败。游戏服务器的很多事故不是算法不会写，而是某个边界没有被产品、客户端、服务端和运营共同看见。只要边界被写进协议和日志，后续扩展就有抓手。

落地时还要注意灰度。任何影响玩家资产、战斗公平或社交关系的逻辑，都不应该全服一次性切换。可以先影子计算，再小流量启用，最后扩大范围。影子计算期间不改变玩家结果，只记录新旧逻辑差异；差异超过阈值时先修规则，不要急着发布。

2. 匹配层的隔离

匹配服务决定是否引入机器人，也决定等待多久后引入。策略要考虑玩家段位、连败保护、地区、时间段、模式类型。引入机器人后要把 bot_reason 写入房间创建参数。不要让战斗服自己偷偷补机器人，否则结算和数据分析不知道本局性质。对于排位模式，人机补位必须有明确规则，并在结算时使用不同积分公式。

3. 机器人身份不能伪装成真实账号

为了表现自然，客户端可以展示机器人昵称和头像，但服务器内部必须使用独立 bot_id 命名空间。机器人不能拥有真实账号资产，不能进入好友关系、举报处罚、交易、邮件等系统。战斗服可以把机器人当作 actor，但账号服务、社交服务和经济服务应能识别并拒绝机器人身份。

4. 奖励限制

训练模式如果完全产出资源，脚本会优先刷训练。结算服务应该按 reward_policy 裁剪奖励：只给首胜练习奖励、不给排行榜积分、任务只计入训练类任务、掉落使用低价值表。奖励限制要在服务器结算执行，客户端提示只是展示。对于新手引导局，可以给固定奖励，但必须与正常 PVP 奖励分开统计。

5. 排行与成就过滤

排行榜、成就、赛季任务是最容易被污染的地方。每个结算事件要带 match_integrity_level，例如 real_players_only、mixed_with_bot、training。排行消费事件时只接受符合要求的完整真实对局。成就系统也要明确哪些成就允许人机局推进。否则“击败 100 名玩家”这种成就会被训练局快速刷完。

6. 数据分析要保留机器人标签

产品分析经常看首局胜率、平均击杀、留存相关战斗表现。如果机器人局没有标签，新手保护会让数据看起来异常乐观。数据管道要保留 bot_count、bot_difficulty、bot_reason、player_segment。分析师可以单独比较真实局和人机局，判断机器人是否真的改善体验，而不是把所有对局混在一起。

7. 战斗服的难度控制

机器人难度不应该硬编码在战斗服里。匹配服务根据玩家画像选择难度，战斗服只加载对应行为参数。战斗过程中可以记录机器人关键决策和反应时间，用于调参。不要让机器人读取服务器隐藏状态做出超人反应，哪怕玩家不知道，也会破坏手感。

8. 风控边界

如果某个玩家大量进入可领奖的人机局，系统要能识别。风控可以按 bot_ratio、reward_per_minute、repeat_mode_count 监控。对异常玩家降低奖励或要求进入真实匹配。人机对局的目标是补齐体验，不是给脚本提供稳定收益通道。

关键数据模型建议

对象	建议字段	设计理由
业务上下文	player_id、server_id、request_id、source、client_build	支持幂等、追踪和客户端版本差异处理。
状态记录	status、version、updated_at、policy_version	让并发更新可控，也能解释当时使用的规则。
审计流水	before、after、decision、reason、operator、trace_id	客服和风控需要还原现场，而不是只看最终结果。
配置引用	config_id、config_hash、effective_at、gray_rule	配置热更新后仍能回放历史行为。

表结构不一定照抄，但这些字段背后的意图要保留。很多团队上线初期为了省字段，只存当前值；等到玩家申诉或活动回滚时，才发现没有办法回答“为什么会这样”。补日志永远只能记录未来，无法修复已经丢失的上下文。

并发与幂等

游戏服务器的并发通常不是数据库 TPS 数字那么简单，而是同一个玩家、同一个公会、同一个房间、同一个活动实例在多个入口被同时修改。移动端重试、网关断线重连、后台补偿脚本、客服工具、活动定时任务都会制造并发。

我的基本原则是：凡是会改变玩家权益或长期状态的命令，都必须有业务幂等键；凡是会覆盖状态的写入，都必须带版本条件；凡是可以从事件重建的派生数据，都不要和主状态互相覆盖。幂等键最好来自业务单号，而不是简单使用 HTTP 请求 ID，因为客户端重试时请求 ID 可能变化。

如果需要跨服务协作，优先把流程拆成“生成计划”和“执行计划”。计划一旦生成就不可变，后续重试只执行同一个计划。奖励、积分、权限变更、外观快照、检查点推进都适合这个模式。它牺牲了一点存储空间，换来的是可重试、可审计和可回放。

可观测性与排查

这类系统上线后，最有价值的监控不是平均延迟，而是状态偏差和规则拒绝。建议至少准备以下指标：

命令成功率、幂等命中率、版本冲突率。
按策略版本拆分的拒绝原因分布。
状态值越界、缺失配置、历史版本读取失败次数。
影子计算的新旧结果差异。
客服查询中最常见的申诉类型。

日志要能串起一次完整请求：网关 trace、业务 request_id、状态版本、配置版本、审计流水 ID。不要只在异常时打日志，因为很多线上争议在程序看来是“正常拒绝”。正常拒绝同样要有结构化原因，否则客服只能告诉玩家“系统判定如此”。

降级策略

降级要按业务价值排序。读展示可以短暂使用缓存，资产写入宁可失败也不要模糊成功；世界广播可以丢弃低优先级消息，私聊和结算结果需要补偿；配置服务慢了可以使用已验证的本地版本，但不能使用未知版本继续发高价值奖励。

一个实用的降级表可以包含：依赖服务、超时时间、失败后的用户提示、是否允许重试、是否写入待处理队列、是否触发告警。这样值班同学看到告警时知道系统已经采取了什么动作，而不是临时读代码。

架构评审清单

这个系统的权威状态在哪里，派生状态在哪里？
任意写操作是否有 request_id 或业务单号做幂等？
配置热更新时，已经开始的流程使用旧版本还是新版本？
玩家断线、重连、跨服、切设备后，状态如何恢复？
客服能否看到操作前后、规则版本和拒绝原因？
如果依赖服务超时，哪些请求允许降级，哪些必须失败？
数据分析能否区分真实行为、补偿行为、跳过行为和灰度行为？

这份清单看起来偏保守，但游戏服务器的长期维护成本通常来自“当时没记录”。只要系统把上下文、版本和决策写清楚，后续做活动、合服、回滚、申诉处理都会轻很多。

小结

这类系统人机对局隔离架构：让机器人参与但不污染真实生态的难点，不在于把第一条链路跑通，而在于让它在真实玩家、真实网络和真实运营节奏里仍然可解释。架构设计要避免把规则藏在某个入口，也要避免把所有职责塞进一个万能服务。

更稳的做法是：主状态收敛，规则版本化，命令幂等，结果可审计，异常可降级。这样即使后续玩法复杂度上升，团队也能围绕清晰边界演进，而不是靠不断补丁维持表面稳定。

← 上一篇 Steam 游戏数据驱动实战：2021 年 4 月个人项目如何管理数值表、配置与平衡 下一篇 → 内存管理：Go 的垃圾回收机制

继续阅读

探索更多技术文章

浏览归档，发现更多关于系统设计、工具链和工程实践的内容。

全部文章返回首页