# 在 A/B 测试中选择正确的流量分配

## 了解如何为你的 A/B 测试选择合适的流量分配方法，避免常见陷阱，确保获得有影响力且有效的结果。

**文章摘要**

*   选择正确的流量分配方法对于 A/B 测试的成功至关重要。
*   **手动分配**提供精确控制，非常适合在实施前需要统计显著性的长期测试。
*   **自动分配**优先考虑数据利用和转化优化，适用于短期测试。
*   A/B 测试应根据具体的测试目标和时间表，战略性地利用这两种方法。

A/B 测试是营销人员的重要工具，它允许企业针对客户体验做出有影响力的、数据驱动的决策。每当你设置具有多个变体的 A/B/n 测试时，确定你希望流量在变体之间如何分布非常重要。每种流量分配选项的行为如下：

## 手动流量分配（经典的 A/B 测试方法）

简而言之，在手动分配中，流量在变体之间平均分配，直到宣布单一获胜者。作为事实上的标准 A/B/n 测试，其假设是：一旦结果达到显著水平，测试管理员将仅向所有访问者分配最佳变体。

例如，如果你启动一个包含四个变体的测试，你可能决定所有变体应具有相等的曝光率，每个变体占 25% 的流量。或者，你可以偏向某些变体，采用任何总计为 100% 的分配比例组合，例如 50/20/20/10。

手动分配测试从定义上讲是变体（以及对照组，如果相关）之间的测试，最终将以高置信度宣布一个变体为获胜者。

## 自动分配（多臂老虎机算法）

通过自动分配（也称为动态分配或多臂老虎机方法），随着收集到更多数据，表现最好的变体将逐渐提供给更大比例的访问者。随着时间的推移，系统会根据可用数据动态地将流量路由到表现最佳的变体。这意味着，即使变体 A 今天表现最好，一个月后，另一个变体也可能超越它。

## 如何为你的 A/B 测试选择正确的流量分配？

每种流量分配方法都针对不同的用例进行了优化。问问自己以下哪种断言更能描述当前的用例：

**1) 我正在寻找最佳变体，以便长期向所有用户展示。** 在这种情况下，选择**手动分配**。
用例示例：布局和用户体验（UX）更改。

**2) 我希望在测试运行的有限时间内充分利用多个变体。** 在这种情况下，选择**自动分配**。
用例示例：主横幅（hero banner）上的促销活动。

当需要统计显著的结果来决定是否对网站进行重大的永久性更改，且时间不是关键因素时，应使用手动分配。手动分配测试可以根据需要运行足够长的时间来收集数据，从而产生高度确定的统计显著结果。

此类测试的缺点是，当你等待显著结果时（这可能需要时间），收集到的数据没有得到充分利用。访问者仍会接触到组合中表现较差的变体。在促销变体更新频繁的情况下，甚至可能没有足够的时间达到显著结果，因此任何优化机会都会丧失。

如果你管理的活动变体生命周期较短，或者它们经常更改和更新，那么多臂老虎机（自动分配）是最佳选择。自动分配对现有数据的利用率更高，在推动流量分配决策时更为激进。自动分配懂得权衡新变体、表现不同的变体、不同时间段等因素。

## 及时性并非在所有事情上都是最好的

应通过时间的视角来看待 A/B 测试和优化——你要么有时间，要么没有。进一步解释，当寻求测试长期变化的影响时（例如新的页面布局，或者就本文而言，电子邮件捕获消息），人们不希望在没有数据支持的情况下过早做出重大或战略性决策。这样做可能会对 KPI 和整体客户体验产生重大影响。

鉴于此，测试需要积累足够的变体数据，以便团队能够自信地宣布获胜者，这个过程至少需要两周时间。在这种情况下，如果企业有奢侈的时间等待统计显著的结果，A/B 测试是理想的选择。

但如果变体的寿命很短，没有时间等待获胜者呢？例如，在促销活动期间，主横幅每周都在变化，主要目标是通过让用户接触表现更好的变体来提高特定的 KPI。

因此，将流量发送到失败的变体实际上会降低点击率（CTR）、转化率或任何用于衡量测试成功的其他主要指标。这正是自动分配非常适合短期决策的原因，因为带来最高结果的变体被更频繁地展示，从而允许团队以更快的速度优化转化。

我们可以从“探索与利用”（Explore vs. Exploit）的角度来思考动态分配，这涉及到在学习上“浪费”了多少，以及利用已学知识的机会。因为在动态分配中，10% 的流量始终提供给随机变体，90% 提供给获胜者，这种 10/90 的探索与利用比例允许流量导向领先变体，同时算法继续学习“失败”的变体，给它们反弹的机会。

## 平衡数据与转化

最后，这两种可用的流量分配方法为企业提供了灵活性，既能获得稳健、长期决策所需的智能，又能获得即时优化的能力。这不是二选一的问题，手动分配和动态分配都应在测试中使用，希望本文能帮助你明确何时使用哪种方法。