评论 AB 实验每日监测

目标函数: 提升收到 bot 评论用户的活跃、留存、互动与创作意愿。报告包含描述性日监测与本周 PSM 匹配验证。

描述窗: 2026-02-27 ~ 2026-03-26 | 本周窗: 2026-03-23 ~ 2026-03-26 | 行为数据最新日期: 2026-03-27

本周匹配样本对
329
D1活跃率(实验组)
63.83%
D1活跃率(对照组)
52.58%
D1活跃Lift
21.39%

核心结论

  1. 触达活跃占比(日均)1.25%,最近一日(2026-03-26)为 1.27% 。
  2. 本周 PSM 匹配样本对 329,D1活跃 Lift 21.39%,D1发帖 Lift 34.07%。
  3. D1评论 Lift -19.67%,说明“创作意愿”提升更明显,但“评论互动”仍需补强。

假设验证

假设A(支持):D1活跃率实验组 63.83%,对照组 52.58%,Lift 21.39%。

假设B(支持):D1发帖率实验组 55.02%,对照组 41.03%,Lift 34.07%。

假设C(不支持):D1评论率实验组 29.79%,对照组 37.08%,Lift -19.67%。

每日触达活跃 vs 其他活跃

对象: 非 bot、非 internal 用户。指标: 当日触达且活跃用户数、当日其他活跃用户数。

触达活跃占比(%)

指标定义: touched_active_users / active_non_bot_users。

本周 PSM 每日验证

方法: 倾向得分 + 同日分层最近邻匹配(无放回)。

index_datematched_pairsd1_active_treatd1_active_controld1_active_liftd3_active_treatd3_active_controld7_active_treatd7_active_control
2026-03-239470.21%56.38%24.53%74.47%70.21%NANA
2026-03-248467.86%58.33%16.33%77.38%66.67%NANA
2026-03-257762.34%55.84%11.63%NANANANA
2026-03-267452.70%37.84%39.29%NANANANA

匹配平衡性 (SMD)

绝对值越接近 0 越好;用于观察匹配前后样本可比性改善。

featurepre_match_smdpost_match_smd
pre7_active_days-0.243-0.106
pre7_comments0.015-0.051
pre7_posts0.2080.015
pre7_received_human0.033-0.067
account_age_days-0.2520.141

描述性日级明细

用于每日巡检触达覆盖与活跃盘子大小。

stat_datetouched_userstouched_active_usersactive_non_bot_usersother_active_userstouched_share_in_active
2026-02-2712997766275651.27%
2026-02-2811790731872281.23%
2026-03-01148122695268301.75%
2026-03-0211486715470681.20%
2026-03-039780678667061.18%
2026-03-048260557655161.08%
2026-03-057154447244181.21%
2026-03-066452494848961.05%
2026-03-079877643363561.20%
2026-03-0811691648263911.40%
2026-03-099966468346171.41%
2026-03-106450415741071.20%
2026-03-116855416441091.32%
2026-03-128264433842741.48%
2026-03-1310080531752371.50%
2026-03-1412398701269141.40%
2026-03-15137101684967481.47%
2026-03-169563563055671.12%
2026-03-176542563055880.75%
2026-03-188663474946861.33%
2026-03-197756481347571.16%
2026-03-209570563155611.24%
2026-03-2112390740973191.21%
2026-03-2213594715770631.31%
2026-03-239459589158321.00%
2026-03-248464595058861.08%
2026-03-257757503149741.13%
2026-03-267461480347421.27%

每日 AB 分组执行

清单文件: /Users/rating/workspace/neta-bi-runtime/task/20260127_AI评论策略整合/history/20260326_comment_ab_bot_participation_daily/data/csv/daily_ab_assignment_plan_20260326.csv

规则: 触达用户强制进入实验组,其余用户按 propensity decile 随机平衡至实验/对照。

反例与边界条件

如果当天触达用户画像偏向高预热人群,实验组表现可能被高估;如果最新日数据未封板,D1 指标可能被低估。

当前为观察性匹配验证,结论用于策略迭代优先级,不替代严格随机因果实验。

行动建议

  1. 优先优化“评论互动”子目标:对实验组追加轻问句二次触达,验证 D1评论率是否回升。
  2. 维持“创作意愿”优势文案:延续高发帖 Lift 的风格组合,并按新老用户分层投放。
  3. 每日复盘匹配样本构成与触达占比,避免样本结构波动掩盖真实策略效果。
作者:Codex | 模型:GPT-5.3-codex | 部署时间(UTC):2026-03-27T08:21:23Z