npx skills add https://github.com/phuryn/pm-skills --skill ab-test-analysis以严谨的统计学方法评估 A/B 测试结果,并将发现转化为清晰的产品决策。
您正在分析 $ARGUMENTS 的 A/B 测试结果。
如果用户提供了数据文件(CSV、Excel 或分析导出文件),请直接读取并分析它们。需要时生成用于统计计算的 Python 脚本。
理解实验 :
验证测试设置 :
计算统计显著性 :
广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
如果用户提供了原始数据,生成并运行一个 Python 脚本来计算这些值。
检查护栏指标 :
解读结果 :
| 结果 | 建议 |
|---|---|
| 显著正向提升,无护栏问题 | 上线 — 推广至 100% |
| 显著正向提升,存在护栏问题 | 调查 — 在上线前理解权衡 |
| 不显著,有正向趋势 | 延长测试 — 需要更多数据或更大效应 |
| 不显著,持平 | 停止测试 — 未检测到有意义的差异 |
| 显著负向提升 | 不上线 — 回退至对照组,分析原因 |
提供分析摘要 :
## A/B 测试结果:[测试名称]
**假设**:[我们的预期]
**持续时间**:[X 天] | **样本量**:[N 对照组 / M 变体组]
| 指标 | 对照组 | 变体组 | 提升 | p 值 | 是否显著? |
|---|---|---|---|---|---|
| [主要指标] | X% | Y% | +Z% | 0.0X | 是/否 |
| [护栏指标] | ... | ... | ... | ... | ... |
**建议**:[上线 / 延长 / 停止 / 调查]
**理由**:[原因]
**后续步骤**:[要做什么]
请逐步思考。保存为 Markdown 格式。如果提供了原始数据,生成用于计算的 Python 脚本。
每周安装量
227
代码仓库
GitHub 星标数
8.1K
首次出现
2026年3月4日
安全审计
安装于
codex216
opencode214
gemini-cli213
cursor213
kimi-cli212
amp212
Evaluate A/B test results with statistical rigor and translate findings into clear product decisions.
You are analyzing A/B test results for $ARGUMENTS.
If the user provides data files (CSV, Excel, or analytics exports), read and analyze them directly. Generate Python scripts for statistical calculations when needed.
Understand the experiment :
Validate the test setup :
Calculate statistical significance :
If the user provides raw data, generate and run a Python script to calculate these.
Check guardrail metrics :
Interpret results :
| Outcome | Recommendation |
|---|---|
| Significant positive lift, no guardrail issues | Ship it — roll out to 100% |
| Significant positive lift, guardrail concerns | Investigate — understand trade-offs before shipping |
| Not significant, positive trend | Extend the test — need more data or larger effect |
| Not significant, flat | Stop the test — no meaningful difference detected |
| Significant negative lift | Don't ship — revert to control, analyze why |
Provide the analysis summary :
## A/B Test Results: [Test Name]
**Hypothesis**: [What we expected]
**Duration**: [X days] | **Sample**: [N control / M variant]
| Metric | Control | Variant | Lift | p-value | Significant? |
|---|---|---|---|---|---|
| [Primary] | X% | Y% | +Z% | 0.0X | Yes/No |
| [Guardrail] | ... | ... | ... | ... | ... |
**Recommendation**: [Ship / Extend / Stop / Investigate]
**Reasoning**: [Why]
**Next steps**: [What to do]
Think step by step. Save as markdown. Generate Python scripts for calculations if raw data is provided.
Weekly Installs
227
Repository
GitHub Stars
8.1K
First Seen
Mar 4, 2026
Security Audits
Gen Agent Trust HubPassSocketPassSnykPass
Installed on
codex216
opencode214
gemini-cli213
cursor213
kimi-cli212
amp212
Excel财务建模规范与xlsx文件处理指南:专业格式、零错误公式与数据分析
40,800 周安装