目标函数: 提升收到 bot 评论用户的活跃、留存、互动与创作意愿。报告包含描述性日监测与本周 PSM 匹配验证。
假设A(支持):D1活跃率实验组 63.83%,对照组 52.58%,Lift 21.39%。
假设B(支持):D1发帖率实验组 55.02%,对照组 41.03%,Lift 34.07%。
假设C(不支持):D1评论率实验组 29.79%,对照组 37.08%,Lift -19.67%。
对象: 非 bot、非 internal 用户。指标: 当日触达且活跃用户数、当日其他活跃用户数。
指标定义: touched_active_users / active_non_bot_users。
方法: 倾向得分 + 同日分层最近邻匹配(无放回)。
| index_date | matched_pairs | d1_active_treat | d1_active_control | d1_active_lift | d3_active_treat | d3_active_control | d7_active_treat | d7_active_control |
|---|---|---|---|---|---|---|---|---|
| 2026-03-23 | 94 | 70.21% | 56.38% | 24.53% | 74.47% | 70.21% | NA | NA |
| 2026-03-24 | 84 | 67.86% | 58.33% | 16.33% | 77.38% | 66.67% | NA | NA |
| 2026-03-25 | 77 | 62.34% | 55.84% | 11.63% | NA | NA | NA | NA |
| 2026-03-26 | 74 | 52.70% | 37.84% | 39.29% | NA | NA | NA | NA |
绝对值越接近 0 越好;用于观察匹配前后样本可比性改善。
| feature | pre_match_smd | post_match_smd |
|---|---|---|
| pre7_active_days | -0.243 | -0.106 |
| pre7_comments | 0.015 | -0.051 |
| pre7_posts | 0.208 | 0.015 |
| pre7_received_human | 0.033 | -0.067 |
| account_age_days | -0.252 | 0.141 |
用于每日巡检触达覆盖与活跃盘子大小。
| stat_date | touched_users | touched_active_users | active_non_bot_users | other_active_users | touched_share_in_active |
|---|---|---|---|---|---|
| 2026-02-27 | 129 | 97 | 7662 | 7565 | 1.27% |
| 2026-02-28 | 117 | 90 | 7318 | 7228 | 1.23% |
| 2026-03-01 | 148 | 122 | 6952 | 6830 | 1.75% |
| 2026-03-02 | 114 | 86 | 7154 | 7068 | 1.20% |
| 2026-03-03 | 97 | 80 | 6786 | 6706 | 1.18% |
| 2026-03-04 | 82 | 60 | 5576 | 5516 | 1.08% |
| 2026-03-05 | 71 | 54 | 4472 | 4418 | 1.21% |
| 2026-03-06 | 64 | 52 | 4948 | 4896 | 1.05% |
| 2026-03-07 | 98 | 77 | 6433 | 6356 | 1.20% |
| 2026-03-08 | 116 | 91 | 6482 | 6391 | 1.40% |
| 2026-03-09 | 99 | 66 | 4683 | 4617 | 1.41% |
| 2026-03-10 | 64 | 50 | 4157 | 4107 | 1.20% |
| 2026-03-11 | 68 | 55 | 4164 | 4109 | 1.32% |
| 2026-03-12 | 82 | 64 | 4338 | 4274 | 1.48% |
| 2026-03-13 | 100 | 80 | 5317 | 5237 | 1.50% |
| 2026-03-14 | 123 | 98 | 7012 | 6914 | 1.40% |
| 2026-03-15 | 137 | 101 | 6849 | 6748 | 1.47% |
| 2026-03-16 | 95 | 63 | 5630 | 5567 | 1.12% |
| 2026-03-17 | 65 | 42 | 5630 | 5588 | 0.75% |
| 2026-03-18 | 86 | 63 | 4749 | 4686 | 1.33% |
| 2026-03-19 | 77 | 56 | 4813 | 4757 | 1.16% |
| 2026-03-20 | 95 | 70 | 5631 | 5561 | 1.24% |
| 2026-03-21 | 123 | 90 | 7409 | 7319 | 1.21% |
| 2026-03-22 | 135 | 94 | 7157 | 7063 | 1.31% |
| 2026-03-23 | 94 | 59 | 5891 | 5832 | 1.00% |
| 2026-03-24 | 84 | 64 | 5950 | 5886 | 1.08% |
| 2026-03-25 | 77 | 57 | 5031 | 4974 | 1.13% |
| 2026-03-26 | 74 | 61 | 4803 | 4742 | 1.27% |
清单文件: /Users/rating/workspace/neta-bi-runtime/task/20260127_AI评论策略整合/history/20260326_comment_ab_bot_participation_daily/data/csv/daily_ab_assignment_plan_20260326.csv
规则: 触达用户强制进入实验组,其余用户按 propensity decile 随机平衡至实验/对照。
如果当天触达用户画像偏向高预热人群,实验组表现可能被高估;如果最新日数据未封板,D1 指标可能被低估。
当前为观察性匹配验证,结论用于策略迭代优先级,不替代严格随机因果实验。