众所周知,A/B测试是一项热门技能,有不少数据科学相关岗位的面试题目都与之相关。但与此同时,有助于准备A/B测试相关面试题目的资源却很少,从而导致大多数候选人在这些面试中表现不佳。事实上,A/B测试实验领域一直在发展,每年都有越来越多关于A/B测试的新的概念和方法。这就意味着即便是几年前自诩A/B测试经验丰富的候选人,如今也经常会在面试中被难住。在这篇文章中,我们将模拟面试官和候选人的对话来进行A/B测试相关的模拟面试,帮助你了解面试官要的是什么,以及如何顺利通过这些面试。你可能会问,为什么我们需要模拟面试?原因是,作为数据科学岗位,我们有时会在沟通方面遇到困难。因此,在脑海中记住一个有效的沟通模板会对你有很大帮助。在本文中,我们将使用食品配送公司Doordash的面试案例进行讲解,该公司的手机App目前在iPhone App Store 中排名第一。他们通过实验不断改进他们的App,并且也在不断寻找有A/B测试相关技能的候选人。
面试题Doordash目前正在扩展更多业务,例如便利店跑腿送货。由于他们之前的推送通知策略效果很成功,于是他们正在考虑在应用内部发送通知来推广这个新业务。那么,你将如何设计实验以决定他们是否应该在应用内部发送通知呢?解决方案第一步 — 提出明确的问题以更好地理解业务目标和产品功能细节在这一步,面试官希望看到什么——
-
在深入研究实验细节之前,你是否首先明确了产品/业务目标?
候选人:在开始设计实验之前,我想确保我对产品背景的理解是清楚的。像这样的产品可能有多个目标——例如增加新用户获取、增加用户的转化率、增加该类别中的订单数量或增加总订单价值。请问我应该具体针对哪个目标进行实验呢?
面试官:这个问题问得很好。通过应用内部通知,我们主要是想尝试提高用户的转化率——即在所有登录的用户中,在新的业务类别下订单的用户的百分比。
候选人:好的。除此以外,我还想了解更多关于推送通知的信息——推送通知的内容是什么,以及目标受众是谁?
面试官:我们目前不提供任何折扣优惠,推送通知只是为了让用户知道我们推出了新的服务业务。如果实验证明这样做的确有效的话,我们打算向所有用户推送通知。候选人:好的,谢谢你的补充,下一步我可以开始深入研究实验细节了。
第二步 — 陈述商业假设、零假设,定义要评估的指标面试官想看到什么——
-
除了主要指标之外,你还考虑了次要指标和护栏指标。
第三步 — 选择显著性水平(significance level)、统计功效(statistical power)、MDE (最小预期提升幅度)并计算实验所需的样本量和持续时间面试官想看到什么——
-
你对统计概念的了解以及对样本量和持续时间的计算;
-
你是否在进行实验时考虑了网络效应(在 Doordash、Uber、Lyft、Airbnb 等双边市场或 Facebook、LinkedIn 等社交网络中很常见)、星期几效应、季节性或新奇效应等可能会影响实验的有效性。
-
Baseline conversion(基线转换):这是在进行实验之前,控制组的现有用户转换率
-
Minimum detectable difference(最小可检测差异)或 MDE:这是我们实验时可以接受的转化率的最小变化,比这更小的变化我们可以忽略不计
-
Statistical Power(统计功效):我们有多大概率可以拒绝原假设
-
Significance Level(显著性水平):当原假设为正确时拒绝原假设的概率
-
Day of week effect(星期几的影响)——你可能在周末和工作日有不同的用户群体,因此运行足够长的时间来捕捉每周的周期是很重要的。
-
Seasonality(季节性)——有时用户的行为会有所不同,这是需要考虑的重要因素,例如假期。
-
Novelty effect(新奇效应)——当你引入一个新功能,尤其是一个容易被注意到的功能时,它最初会吸引用户去尝试。这意味着,一个测试组一开始可能看起来表现不错,但效果会随着时间的推移而迅速下降。
-
External effects(外部影响)——假设市场竞争很大,同类应用的推送通知很多,消费者很有可能会忽略掉我们的推送,这将直接影响我们实验的准确性。
第四步 — 分析结果并得出有效结论面试官想看到什么——
-
你在不同场景中会使用适当的统计检验的知识(例如,针对样本均值的t检验和针对样本比例的 z 检验)
-
你是否检查了随机化
-
你提供的最终建议
-
为了使实践的效果最佳,我们应该在分配测试组和对照组时检查随机化是否合理。为此,我们可以查看一些预计不会受到实验影响的基线指标,并对两组进行比较,比如,比较两组之间基线指标的直方图或密度曲线。如果没有差异,我们可以得出结论,随机化是合理的。
-
所有指标(包括主要指标和护栏指标)的显著性测试。我们的主要指标(转化率)和护栏指标(卸载率)都是比例,因此我们可以使用 z 测试来检验统计显着性,我们可以使用诸如 R 或 Python 之类的编程语言来做到这一点。
如果从统计角度来讲,转化率显著增加,但是卸载率受到负面影响,我建议不要实施内部推送。最后,如果从统计角度来讲,转化率没有显著提高,我建议不要实施内部推送。
面试官:非常好,感谢你的回答。
结论
如果在A/B测试面试中表现出色的话,将为你在招聘过程中提供非常大的优势,使你脱颖而出,因此,花时间学习A/B测试中的关键概念,并且为面试做好准备是非常重要的。
以上就是“为什么Tech公司最常见的面试题通过率却最低?”的详细内容,想要了解更多IT圈内资讯欢迎持续关注编程学习网。
扫码二维码 获取免费视频学习资料
- 本文固定链接: http://phpxs.com/post/10966/
- 转载请注明:转载必须在正文中标注并保留原文链接
- 扫码: 扫上方二维码获取免费视频资料