评论 AB 实验:用户回复策略bot评论与互动过程

窗口:2026-03-23 ~ 2026-03-26 | 样本对数:329(PSM 匹配)

实验组 D1回复评论率
10.03%
对照组 D1回复评论率
10.94%
实验组 D1回复策略bot评论率
0.30%
对照组 D1回复策略bot评论率
0.00%

核心结论

  1. 实验组 D1 回复评论率 10.03%,对照组 10.94%,Lift -8.33%。
  2. 实验组 D1 回复策略bot评论率 0.30%,对照组 0.00%,Lift NA。
  3. 实验组“直接回复触达 bot 评论(同日~D1)”比例 1.22%,链路中 bot 再跟进率 0.00%。

假设验证(是否提升互动回复)

假设A(待观察):D1回复评论率实验组低于对照组(p=0.702664,未达到统计显著);假设B(弱支持):D1回复策略bot评论率实验组高于对照组(p=0.316942,未达到统计显著)。

补充:直接回复触达 bot 的首响时延中位数 1.39 分钟,P75 为 298.06 分钟。

实验组 vs 对照组证据表

指标实验组对照组Liftp-value
D1回复评论率10.03%10.94%-8.33%0.702664
D1回复策略bot评论率0.30%0.00%NA0.316942

每日分解

index_datepairstreated_reply_anycontrol_reply_anytreated_reply_bot_anycontrol_reply_bot_any
2026-03-23949.57%17.02%0.00%0.00%
2026-03-248411.90%9.52%0.00%0.00%
2026-03-257714.29%7.79%1.30%0.00%
2026-03-26744.05%8.11%0.00%0.00%

互动过程案例(成功)

互动过程案例(未形成直接回复)

反例与边界条件

控制组“回复策略bot评论”不一定为 0,因为用户可能通过其他入口接触到策略bot评论;因此该指标是相对差异而非绝对隔离。

本分析基于匹配样本,仍属于观察性验证,不能完全替代严格随机因果实验。

最新一天包含 T+0 数据,存在未封板低估风险。

行动建议

  1. 将“D1回复评论率 / D1回复策略bot评论率 / 直接回复触达bot率”纳入每日AB看板主指标。
  2. 对未形成直接回复的触达样本,增加二次跟进策略(同日轻问句 + D1情绪鼓励)。
  3. 将链路案例做成周复盘固定模块,优先优化高触达低回复的人群段。
作者:Codex | 模型:GPT-5.3-codex | 部署时间(UTC):2026-03-27T08:22:21Z