在Unity Mecanim中实现透传状态的动作同步
最近公司上线了一个休闲小游戏, 我操刀了游戏的动画部分, 也在项目里摸索出了一套基础但可用的动作同步方案. 这个方案并不保证完全的可靠, 但所谓适合的才是最好的 ——它对大多数非延迟敏感的小游戏来说都已经够用, 且能在不依赖三方插件的情况下快速搭建, 因此还是在这里分享一下.

基本介绍
Unity自带的动画系统称为Mecanim, 这是一种基于有限状态机的动画系统; 每一个Layer都会维持一个活跃的状态 (State), 而状态持有动画片段 (motion), 活跃状态的动画片段会被播放. 多个Layer按照遮罩 (Mask) 层层叠加, 达到最终的动画效果.

想要播放一个状态的动画有多种方式: 除了在AnimatorController里设置过渡条件由Unity自动处理外, 还可以使用CrossFade API进行手动强制播放:

因此一个比较容易想到的方案是, 将本地正在播放的动画状态及其相关信息同步出去, 其它客户端接受这些信息并在本地通过CrossFade重现动作, 以此达到基本的动画同步效果.
然而, 以上只是很理想的表述, 实操中如果直接采用这个方案会带来很多问题, 下面我会说一下基于这个同步方案的详细设计, 以及如何规避掉这些问题让其真正可用.
方案细节
同步参数还是状态?
如果是通过转发消息实现多端同步, 最直观的做法其实是广播本地AnimatorController的状态参数 (Parameters), 并在多端使用同一个AnimatorController执行, 有点类似于帧间同步的思路, 通过维护输入的一致来保证结果的一致.
这么做本身并没有很大问题, 但考虑到实际情况下的网络延迟, 直接广播参数就不那么可用了 —发送顺序 != 接受顺序, 对于同一个状态机, 参数变化的先后顺序不同可能导致完全不同的结果, 从而使接收端的状态乱掉.
当然, 通过缓存队列来确保消息顺序可以避免消息时序的问题, 但是Animator执行动画状态本身也需要时间, 接收端很难确定从缓存中取新数据的时机, 这实在太麻烦了!

相比之下, 广播状态 (State) 的方案显得更可靠些. 虽然时序问题仍然存在, 但由于是结果到结果的传递, 不会出现广播参数时”一步错步步错”的情况. 此外, 接收端也不再需要因此考虑动作执行时间, 因为发送端会传递可直接到达的最新状态.
不过仅广播状态也有很大的局限性. Mecanim的状态 (State) 还可以持有更复杂的子结构 (如根据速度值进行融合的Idle-Move-Run 混合树) , 它们往往需要另外的数据 (如速度值) 来做出正确的表现.
因此, 我采用的做法是同时广播状态Hash (StateNameHash) 和 连续参数 (如控制Move-Run混合的速度参数) 来达到基础的同步效果, 参见一个如下的数据结构:
1 | [] |
注:. CrossFadeAPI确定一个目标状态至少需要状态(StateNameHash)和层(AnimLayer), 因此它们都要被包含在广播数据中. ↩
你会注意到, 广播发出的State信息分为了三段, 除了包括当前Playing状态的StateNameHash, 还包括了当前状态下一个状态的NextStateNameHash以及当前状态已播放的时间StateNormalizedTime. 这些额外参数的设置并不是必须的, 它们是为了优化表现和减少延迟, 并和Unity Mecanim的过渡机制有关. 详细的说明可以参见这里.
本地玩家数据的发送
确定了要同步的数据, 接下来我们也要思考发送数据同步的时机. 随着项目的扩张, AnimatorController里的参数和状态都会逐渐变多, 我们很显然不能每一帧都广播所有的状态, 这会造成巨大的流量消耗.
为了让同步更精确, 这里我采用容器缓存+下一帧转发的方案, 参考如下代码:
1 | // Sync容器 |
可以看到, 代码里做了多重处理. 默认该系统将不会传输任何数据. 只有当m_ThisFrameSyncRequestLayers缓存具有数据时, 才会在下一帧发送对应层 (Layer) 的动画数据. 每当玩家进行动作 (如使用了某个道具), 只需调用下面所展示的函数更新缓存, 同步系统就会自动处理.
1 | /// <summary> |
注. 下一帧才发送数据的原因是等待Animator的状态更新 ↩
我们已经剔除了多数的情况, 实际上这里可以更进一步缓存已转发状态, 防止持续广播同一个状态.
同步玩家数据的接收
接收端的处理逻辑需要解决两个主要问题: 异步初始化和状态一致性判断.
由于网络消息的到达时机可能早于玩家实体的初始化完成, 接收端不能立即应用动画数据. 系统使用异步等待机制, 等待目标玩家持有AnimatorController的组件准备就绪后再处理.
当Animator准备就绪后, 我们做两件事:
- 首先设置Animator的连续参数 (如速度参数), 这些参数对于混合树等需要连续值控制的状态至关重要.
- 接下来是状态一致性判断: 系统会比较本地当前状态和下一个状态与广播数据中的状态Hash. 如果完全一致, 则跳过更新, 避免不必要的动画重播, 这个优化可以显著减少在稳定状态下的重复同步开销.
1 | public void PlayFromBroadcast(BroadcastAnimUpdateData broadcastData) |
至此, 我们打通了从发送到接收的大致流程.
傀儡接收端
不知道你有没有真的跟着上面的思路实操一遍, 如果做了, 你一定会意识到直接在接收端 (其他玩家) 的Player上套用自己的AnimatorController是不行的. 仔细想想就会发现, 发送端 (即自己玩家) Animator的状态变化依赖于外部对Animator Parameters 的设置, 而接收端并没有同步的提供这些 Parameters 信息, 很容易发生某个过渡条件在意外达成而把本地状态切走的情况.
解决这个问题的一个办法是生成一份状态完全相同, 但取消所有过渡的复制状态机, 我称其为傀儡 (ClipOnly) 状态机:

作为对比, 以下图片展示的是上图状态机的原版 (本地执行版):

将ClipOnly状态机作用于 (本地同步的) 其它客户端玩家, 而带过渡的完整状态机作用于受控的自己玩家, 就可以实现本地玩家执行完整动作逻辑, 而 (本地同步的) 其它客户端玩家 (即接收端) 则相当于成为了一个傀儡: 只根据接收到的数据播放特定的动作状态, 自己没有切换State的能力.
细心的读者可能发现, 上图我贴的ClipOnly状态机截图并不真的取消了所有过渡. 实际上, 我确实保留了一部分满足特定条件的过渡到傀儡状态机上, 让我们随便挑两个看看:


这些被转移的过渡均有且只有HasExitTime这一个过渡条件, 意味着它们在本地端都是可以无条件自动执行的过渡. 既然如此, 保留这些过渡到傀儡状态机, 在恰当的时机内傀儡状态机也能够处理这些过渡, 减少表现上的延迟.

另外, 我们也可以通过这种方式处理那些本地状态机里过渡到Exit状态的场景. 如上图所示的过渡是一个典型的”一次性”动作, 典型案例为打招呼, 使用道具等只需要播放一次就退出的动作. 在傀儡状态机上保留这些自动退出过渡可以保证这些一次性状态在接收端也能正确的退出.
从模板AnimatorController生成傀儡AnimatorController的工具程序我上传了在了文章末尾的附录部分, 感兴趣的同学可以自行翻阅一下.
数据的保持
截止目前, 我们提到的所有网络传输办法都是基于广播 (Broadcast). 通常来讲, 服务器并不会在这种简单的透传过程里持久化保存信息. 这就带来一个问题: 如何将数据持久化? 或者具体的来说, 一个新进入的玩家如何获取到其他玩家当前的状态?
我的解决方案是主动推送完整状态: 当检测到新玩家加入时, 现有玩家会主动向新玩家发送完整的动画状态信息. 系统通过监听玩家加入事件来触发完整同步. 当新玩家加入房间时, 所有现有玩家都会收到通知, 并开始向新玩家推送状态.
1 | // 推送所有目前已发生的Override |
完整同步包括两个部分:
- 所有层的动画状态:
系统会遍历所有动画层, 获取每个层的当前播放状态, 包括状态Hash、归一化时间、下一个状态Hash等信息, 然后通过广播发送给新玩家. - 所有已覆盖的动画Clip:
由于系统支持多Clip状态同步, 新玩家还需要获取所有已覆盖的Clip信息. 系统会遍历所有缓存的覆盖信息, 逐个广播给新玩家.
数据持久化是广播机制的一个固有缺陷, 但通过主动推送完整状态的方式, 我们可以在不改变服务器架构的前提下, 为新玩家提供基本的同步支持. 虽然这个方案存在一些缺点, 但对于小规模多人游戏和休闲类游戏, 它已经足够使用.
如果项目需要支持更大规模的多人场景, 或者对同步的实时性要求更高, 建议考虑引入服务器快照机制或其他持久化方案.
高级功能
以上设计是在项目初期搞定的, 能够适应大部分比较基础的功能. 不过随着项目的迭代, 这套同步机制也需要一些功能上的扩展来适应新的业务需求, 这里也总结一下供想使用这套方案的同学参考.
预表现
网络延迟是动作同步系统面临的主要挑战. 如果接收端总是等待发送端的状态变化后再播放动画, 玩家会明显感受到延迟带来的卡顿.
我们先来简单回顾一下Unity Mecanim的动画过渡机制: 当有可用的过渡状态时, Unity 首先将该状态安排为NextState, 随后执行过渡. 当过渡完成后, 该NextState成为新的CurrentState, 这样就完成了一次过渡.

并且, Unity提供了获取”正在过渡状态”的API, 意味着我们可以在某个状态将要播放的时候就得知这个信息, 并提前发送出去.

基于这种时间差, 我们可以实现一个简易的预表现功能. 核心思想是: 当发送端检测到状态机即将发生过渡时, 提前将下一个状态的信息一并发送, 接收端可以提前开始过渡动画, 从而减少视觉延迟.
在发送端, 我们可以通过Unity Mecanim的GetNextAnimatorStateInfo API检测当前层是否正在过渡到下一个状态. 如果检测到过渡 (返回的状态Hash不为0), 则将其包含在广播数据中. 这个检测发生在延迟一帧发送之前, 确保能捕获到即将发生的状态变化:
1 | public void SendBroadcastAnimation(DefAnimatorController_Player.Layers layer) |
而在接收端, 当接收到包含NextStateNameHash的广播数据时, 系统会立即使用CrossFade开始过渡到下一个状态, 而不是等待当前状态播放完成. 这样, 即使网络存在延迟, 接收端也能在发送端状态切换的同时 (或更早) 开始过渡动画. 你可以对比一下下面逻辑和基础版的差异:
1 | public void PlayFromBroadcast(BroadcastAnimUpdateData broadcastData) |
状态的多态化
在实际项目中, 经常遇到同一个动画状态需要根据不同的上下文播放不同的动画片段的需求. 例如, 玩家持有不同物品时, “持握”状态应该播放不同的动画; 或者不同角色使用同一个状态机时, 某些状态需要播放角色特定的动画.
Unity提供了AnimatorOverrideController来解决这个问题. 它可以在运行时动态替换基础AnimatorController中某个状态对应的动画Clip, 而不需要修改状态机结构. 我们的同步系统也基于此实现了多Clip状态的同步.

要做到这一点, 首先需要Animator的runtimeAnimatorController替换为基于当前Animator模板生成的新AnimatorOverrideController, 这样就赋予了Animator动态替换片段的能力. 使用Unity提供的API可以很轻松的做到这一点:
1 | // 基于当前模板创建新的 AnimatorOverrideController |
下图是一个被替换了runtimeAnimatorController字段的Animator组件, 可以看到Controller字段的名称已经被抹去, 说明不再使用原始的AnimatorController资源.

在替换runtimeAnimatorController后, 我们可以轻松的将某个原始Clip替换为另一个:
1 | m_OverrideController[clipNameInBaseController] = clip; |
注意, 这里用于索引的clipNameInBaseController是Clip名称, 而不是State名称. 所以要使用这种方式覆盖, 请确保你要被覆盖的状态中已经持有了一个动画片段, 随后用该片段的名称去索引.
部分状态甚至不持有默认的motion. 我的项目里准备了一些空的动画片段, 专门用于赋值给它们以实现后续索引:

系统的设计遵循”覆盖即同步”的原则: 当本地端覆盖了某个Clip后, 自动触发同步广播, 其他客户端接收到后应用相同的覆盖. 这样保证了多端状态机结构的一致性, 同时允许不同上下文下的动画表现差异化.
在本地端, 只需异步加载指定的动画资源, 然后将其设置到AnimatorOverrideController中. 为了性能考虑, 系统应当缓存已加载的动画资源, 避免重复加载. 以下是一段可供参考的代码:
1 | /// <summary> |
实现本地的Clip覆盖后, 将这个操作也转发出去, 使接收端执行同样的操作, 就能实现状态替换的同步. 当State和Motion都保持同步后, 动画整体也就实现了同步. 仔细的读者会发现上面提供的函数被标记为了protected virtual, 在我的项目中, OverrideAnimationClip是一个被发送端玩家和接收端玩家复用的逻辑 (我认为也应当这么做).
具体的逻辑为, 当本地端成功覆盖Clip后, 会自动触发同步广播. 接收端通过专门的Handler处理覆盖广播, 并应用相同的覆盖.
1 | // 发送玩家class中按如下方式重写 |
1 | // 接收端玩家中触发覆盖的接口 |
需要注意的是, 覆盖Clip后需要重新播放当前状态才能使新Clip生效. 这是因为AnimatorOverrideController的覆盖是在状态机层面进行的, 已经播放的状态不会自动更新. 因此, 接收端在应用覆盖后会立即使用CrossFade重播当前状态. 这个处理也用于解决OverrideAnimationClip和StateUpdate时序的问题 ——无论OverrideAnimationClip先后到达, 正确的动画总会播放至少一遍.
这个机制在项目中有多个典型应用场景:
物品持握动画: 当玩家拿起不同物品时, 同一个”持握”状态会播放不同物品对应的持握动画.
个人秀动画: 个人秀系统使用这个机制来播放不同的动作动画. 同一个”个人秀”状态可以根据配置播放不同的动画Clip, 包括前摇、主动作和后摇动画, 每个部分都可以独立配置和同步.

移动混合树: 某些情况下需要替换移动混合树中的Idle、Walk、Run动画, 例如角色换装后需要播放新的移动动画.
并且很爽的一点在于, 对于同一个State接口 (姑且把同一个State的多个motion实现看做接口-实现的关系), 你不需要写额外的代码去处理它们的替换.
总结
这套代码大概在线上跑了几个月, 基本功能符合预期, 目前没有很多和动作同步相关的Bug汇报 (当然也可能是因为项目目前的DAU不是很高, 一些隐藏的问题或许还没有暴露). 这里我用自己对它的理解做一下优缺点总结.
这套动画同步方案体现了实用主义的设计哲学: 不追求完美的同步效果, 而是在保证基本可用的前提下, 通过简单实现和工具支持, 快速满足项目需求. 对于适合的场景, 这套方案能够以较低的成本提供可用的同步效果. 对于不适合的场景, 则这篇文章可能并非你的受众, 你需要考虑更复杂的同步方案, 如状态同步、帧同步等.
最重要的是, 在选择同步方案时, 需要根据项目的实际需求、团队的技术能力、开发时间等因素综合考虑. 没有完美的方案, 只有最适合的方案.
优点
实现简单, 快速搭建
这套方案的核心思路非常直观: 发送端广播当前播放的状态, 接收端通过CrossFade重现. 不需要复杂的帧同步机制, 不需要状态回滚和预测, 也不需要依赖第三方网络同步插件. 对于有一定Unity开发经验的开发者, 可以在几天内完成基础实现.
几乎无需服务器支持
由于几乎所有信息都通过转发实现, 服务器只需要提供最基础 (也是最通用) 的透传协议, 不需要记录和维护状态. 如果你只想开发简单的联机小游戏, 这会很大的节省你在服务器开发上的开销.
工具链完善, 维护成本低
通过两个编辑器工具 (Clip-Only生成工具和代码生成工具), 我们实现了从状态机设计到代码使用的完整工具链. 状态机的修改可以快速同步到代码和Clip-Only版本, 降低了维护成本.
在框架的能力限度内, 横向扩展性良好
系统支持多Clip状态同步, 通过
AnimatorOverrideController机制, 可以在保持状态机结构不变的前提下, 灵活地为不同上下文配置不同的动画表现. 这种设计既满足了表现多样性的需求, 又维持了状态机逻辑的简洁性.
缺点
- 延迟敏感场景不适用
这套方案的核心问题是延迟不可避免. 即使有预表现机制, 网络延迟仍然会导致接收端看到的状态变化晚于发送端. 对 于需要精确同步的场景 (如竞技类游戏、格斗游戏), 这种延迟是不可接受的.
状态同步虽然避免了参数同步的累积误差, 但每次状态变化都需要等待网络传输, 在高延迟环境下 (如跨地区联机), 延 迟会更加明显.
- 网络抖动影响表现
当网络出现抖动或丢包时, 接收端可能会出现动画”跳跃”或”卡顿”的现象. 虽然你可以设置超时保护机制, 但无法完全消 除网络问题带来的影响.
如果连续多个状态变化消息丢失, 接收端可能会”跳过”某些中间状态, 直接播放最终状态, 导致动画不连贯. 虽然这种情 况不常见, 但在网络环境较差时确实可能出现.
- 时间同步精度不足
对于循环动画 (如Idle、Walk), 这个问题影响不大. 但对于一次性动画 (如攻击、技能), 可能会导致接收端看到的动画 进度与发送端不一致.
适用场景
休闲类游戏:
这套方案最适合休闲类游戏, 特别是那些对延迟不敏感、更注重社交互动的游戏. 例如:
农场类游戏: 玩家主要进行种植、收获等操作, 动作的精确同步不重要
社交类游戏: 玩家更关注其他玩家的存在和基本动作, 而不是精确的动作细节
探索类游戏: 玩家在开放世界中探索, 偶尔看到其他玩家的动作即可
小规模多人游戏:
对于同时在线人数较少 (如2-10人) 的游戏, 这套方案能够提供良好的表现. 因为:
网络流量可控: 每个玩家只需要同步给其他少数几个玩家
延迟影响小: 小规模游戏通常使用P2P或小房间服务器, 延迟较低
维护成本低: 状态机结构相对简单, 容易维护
不适用场景
竞技类游戏:
对于竞技类游戏 (如MOBA、FPS、格斗游戏), 这套方案不适用. 因为:
延迟敏感: 竞技游戏需要精确的同步, 任何延迟都可能导致不公平
需要回滚: 竞技游戏通常需要状态回滚和预测机制来处理网络延迟
精度要求高: 动作的精确同步直接影响游戏结果
实时性要求高的游戏:
对于实时性要求高的游戏 (如音游、节奏游戏), 这套方案不适用. 因为:
时间精度不足: 无法精确同步动画播放进度
延迟影响大: 即使很小的延迟也会影响游戏体验
需要帧同步: 这类游戏通常需要帧级别的同步
附录
这里提供了本文中提到的动作同步方案下经常会用到的两个实用Unity Editor工具. 可以点进它们对应的Url进行下载.