This commit is contained in:
louzefeng
2024-07-11 05:50:32 +00:00
parent bf99793fd0
commit d3828a7aee
6071 changed files with 0 additions and 0 deletions

View File

@@ -0,0 +1,186 @@
<audio id="audio" title="加餐|试验意识改变决策模式,推动业务增长" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/d7/f8/d7ecea9babd42ff2ef55054505fa0cf8.mp3"></audio>
你好我是凯悦。很荣幸能为博伟老师的专栏写篇加餐写这篇文章一方面跟我学习A/B测试的经历有关。另一方面作为极客时间的产品经理我们团队的试验意识也经历了一个从0到1的过程。
一年半前我开始自学A/B测试当时在网上找了很多文章和课程来学习。但有用的资料较少质量也参差不齐讲得也不够透彻所以我花了很长时间来判断资料的正确与否也因此踩了很多坑。
所以在博伟老师这个专栏上线之后,我每周追更,越是往后学习兴趣越浓,心想如果在我学习初期就遇到这个专栏,那是多美好的事。
这篇加餐中我把我们团队从引入、应用A/B测试到建立起试验意识的整个过程分享给正在学习的你。
# 试验意识改变决策模式,推动业务增长
极客时间不是从产品初期就开始使用A/B测试的而是经历了纠偏、引入、应用、总结四个阶段最终形成了较强的试验意识。
- 纠偏改变对A/B测试的错误认识建立正确认识。
- 引入将A/B测试的方法和工具引入到决策过程中而非拍脑袋决定。
- 应用用A/B测试解决一个个实际问题。
- 总结:复盘经验,形成试验意识。
经历了四个阶段的发展,我们建立了完整的试验流程,形成了试验意识,关键点有两个:
1. 每当遇到产品决策问题时第一时间想到A/B测试。
1. 长期坚持使用A/B测试。
这里我着重想说明一下我们在试验意识上的纠偏。正是意识上的纠偏,让我们改变了决策模式,将依据经验决策的单一决策模式切换为依据经验+试验意识的系统决策模式,持续推动业务增长。
# 意识纠偏
曾经以为A/B测试就是设置两个版本分别让两组用户使用转化率高的胜出然后就可以发布上线了。
但事实真是如此吗这样做决策科学吗如果A/B测试如此简单那为什么还是有很多互联网公司没有使用呢
先举个例子一个详情页版本A转化率是1.76%版本B转化率是2.07%。如果你是产品经理你会选用哪个版本呢?
假如再有版本C转化率是2.76%呢再有版本D转化率是11.76%呢?
按照“哪个版本转化率高就上线哪个版本”的决策模式我们应该立即上线版本D。过去我也是这么认为的但实际上是错误地理解了A/B测试。
在我刚才举的例子中,存在三个问题:
- 第一试验只是抽取了一部分用户得出了结论不是全部用户那么当全部用户都使用版本D时转化率还会是11.76%吗?
- 第二版本B、C和D的转化率分别是2.07%、2.76%和11.76%相对于版本A的提升分别是0.31%、1%和10%。是差异越大我们上线这个版本的信心指数就会越高吗显然不是还需要考虑0.31%、1%和10%的提升是实际存在的,还是试验误差导致的?
- 第三当差异多大时我们才能下判断呢换句话说如果上线版本B它是否确实能带来转化率的提升呢实际的提升会是多少呢
由于这三个问题缺少数据支持所以无法回答因此就没法做出是上线版本A还是上线版本B的决策。我们还需要收集更多的信息来回答这三个问题。
回答这三个问题就涉及对科学A/B测试的理解。什么是科学、规范的A/B测试呢博伟老师的专栏已经给出了答案。A/B测试并没有想象中的简单它是一项科学试验涉及到抽样、显著性检验、软件工程、心理学等方方面面。重点要关注试验过程是否科学严谨试验结果是否可信依据这样的A/B测试结果做决策才真正的能推动业务的发展。
# 引入A/B测试
为什么要引入A/B测试呢极客时间用户早已破百万需要实现从野蛮生长到精耕细作的阶段跨越用户增长、数据决策都离不开A/B测试这个工具。它能够在不进行较大改变的情况下使用小部分流量进行试验验证假设得出结论达到优化产品、促进用户留存和活跃的目的。
引入过程中我们采取了三方面的行动。
第一系统学习A/B测试。开始学习时找了大量的资料量虽然多但大部分千篇一律。不过经过不断的学习我们还是总结出了自己的试验流程并尝试应用。当然中间也踩了很多坑进入了不少误区。
所以当编辑同学策划《A/B测试从0到1》这个专栏时我们就发现这个专栏非常实用初学者或进阶者学习过程中遇到的问题不清楚的细节以及需要避免的“坑”博伟老师都有详细的讲解。
第二自建分流系统。学习了理论知识之后就要给研发同学提需求做工具了。我们自建了分流系统然后将整个A/B测试流程跑通这样才能真正地帮助到决策者做判断。
第三将A/B测试纳入产品迭代的流程。现在在做重要产品的迭代前都会做多个版本进行A/B测试这已经成为了团队的共识。
引入并建立了A/B测试观念和意识后接下来就需要动手实践了。博伟老师在专栏中也多次讲过A/B测试的实践性非常强需要在实际业务场景中不断迭代、精进。下面我就通过两个实际案例来看看极客时间是如何从0到1利用A/B测试验证假设以及进行产品迭代的。
# A/B测试实践应用
极客时间有多个重要业务指标其中转化率和复购率两项指标尤为重要。所以我就选择了具有代表性的两个案例来讲解。案例一我们通过A/B测试检验了一个提升复购率的假设。案例二利用A/B测试选出高转化率的详情页。两个案例都说明了试验和试验意识的必要性。
## 案例一:醒目的优惠券样式可以提高复购率吗?
### 案例背景
运营同学想提高完成首单用户的复购率,于是提出想法:在用户完成首单后,让优惠券的展示更加醒目,以促进用户使用。但是这个想法却不被产品经理认可。主要有以下几方面的原因:
1. 首先,现有版本已经有了优惠券展示模块。
1. 其次,整体优惠券使用率不高,而且分析历史数据得知优惠券对促进用户再次购买的效果并不理想。
1. 最后,也是最重要的一点,现有版本有“分享有赏”功能,用户将课程以海报形式分享到朋友圈,其好友通过该海报购买后,该用户能够得到返现。通过这种形式也能促成复购,还有拉新效果。
运营同学和产品经理各有理由,所以在双方互相不能说服的情况下,我们就决定用 A/B测试来解决这一问题而试验结果也让大家颇感意外。
### 试验设计
现有方案是用户完成首单后,系统弹出弹窗,用户可以选择使用优惠券购课或者分享给其他用户获得现金奖励。运营同学提出假设,认为以更醒目的样式展示大额优惠券可以提高复购率,试验的假设就可以表述为“醒目的优惠券能促进用户立即使用优惠券,进而增加复购的概率”。
这里需要说明的是,用户完成首单后,系统会自动将优惠券发送给用户,不需要用户手动领取。
于是产生了实验组的UI样式
<img src="https://static001.geekbang.org/resource/image/e6/bc/e6448d5d0f9cb6f43d7ab21fd0a960bc.png" alt=""><br>
控制组<br>
<img src="https://static001.geekbang.org/resource/image/59/51/590fab4440d0aeca3d4dc12ec4245651.png" alt="">
试验组
接下来就是按照A/B测试的规范流程来设计试验了
- **明确目标和假设。**目标是增加复购,零假设是实验组复购率与控制组没有差异。
- **确定指标。**用复购率作为衡量指标,同时考虑新用户数和营收。(复购率=已支付订单数大于等于两单的用户数/已支付订单数等于一单的用户数)
- **确定试验单位。**使用uid作为试验单位。
- **确定样本量。**我们将实验组与控制组的差值设置为0.6%。这个差值也有其他叫法比如最小可检测效应、实际显著性。算出来最少需要8074个样本。
**实施测试**
经过对历史数据的分析,用户分享率和领取优惠券的领取率没有明显的周期性变化,因此按照样本量与流量确定了试验时长。
做好准备后,开发同学开始使用自建的分流系统,上线测试。
### **结果分析**
进入试验的用户有17652人在功效80%置信度95%时置信区间不收敛并且P值大于0.05,不拒绝原假设。我们又试验了一段时间,发现依然如此。因此判断实验组并不比原版本效果好。
使用R语言的prop.test函数计算结果如下图<br>
<img src="https://static001.geekbang.org/resource/image/3c/a5/3c5e63a713bf21bb327d3ed12d89a3a5.png" alt="">
试验结果汇总如下表所示:<br>
<img src="https://static001.geekbang.org/resource/image/f6/77/f631b3350bdfe454d6d01568a0d78b77.png" alt=""><br>
试验过程中我们还收集了另外两个指标:<br>
<img src="https://static001.geekbang.org/resource/image/d7/1f/d7a7528f8d303dc39120a44a27d8d91f.png" alt=""><br>
通过辅助指标,我们发现原版本能带来更多的用户,且用户更有动力分享促进用户购买。并且经过分析,排除了“大部分新用户是由少数几个老用户的分享带来的”这种情况。
### **做出决策**
从试验数据来看置信区间包含“0”值意味着实验组比控制组的转化率有可能增加0.098%也有可能降低0.733%。
此外在拉新能力上原版本是实验组的5倍成交金额上前者是后者的3.6倍。差别之大令我们感到意外幸好有试验的意识先通过A/B测试对idea做了检验如果拍脑袋决策直接采纳这个建议那会给公司带来损失。
基于以上两个原因我们决定继续使用原版本。
### 案例思考
该案例中采取了“大胆假设小心求证”的决策方式当提出了“通过醒目的优惠券设计刺激复购”的idea时产品经理第一时间想到用A/B测试的方法来验证想法是否可行。既不臆断拒绝也不盲目接受。而是试验意识驱动采用A/B测试方法收集数据分析数据科学决策。这也就是我在文章开头所说的试验意识的第一个关键点当涉及产品变化的决策时首先想到A/B测试。
## 案例二:选出高转化率的详情页
有了前车之鉴我们在产品迭代时也开始养成肌肉记忆不断使用A/B测试。
### 案例背景
APP的课程详情页需要版本迭代。产品经理思考通过强化促销价格能否提升详情页的转化率
### **试验设计**
设计了两种UI样式如下图
<img src="https://static001.geekbang.org/resource/image/a9/48/a9369fca9d8a0bd9ca0e0735a8f7c448.png" alt=""><br>
实验组版A<br>
<img src="https://static001.geekbang.org/resource/image/a9/48/a9369fca9d8a0bd9ca0e0735a8f7c448.png" alt=""><br>
实验组版本B
- **确定指标。**用转化率作为衡量指标。
- **确定试验单位。**使用uid作为试验单位。
- **确定样本量。**我们将实验组与控制组的差值设置为1.5%计算后大概需要样本量1.7万。因为我们流量较大按照原定分流计划1-2天的时间就能达到最小样本量。由于用户在周末活跃数据会骤降为了覆盖一个用户活跃周期同时为了尽量避免新奇效应我们适量缩小试验流量占总流量的比例将试验时长设置为一周。
- **实施测试。**做好准备后,开发同学上线测试。
### **结果分析**
为避免“学习效应”,上线试验后,我们持续监测每天的指标;各项指标的变化都很稳定,符合预期,排除了“学习效应”。
试验结果如下:
<img src="https://static001.geekbang.org/resource/image/43/64/43af1348d1f71eceb83dd1ecd2262164.png" alt=""><br>
进入试验的用户有23686人在功效80%置信度95%时置信区间不收敛p值大于0.05不拒绝原假设,两个版本没有显著差异。
此时,陷入僵局,试验结果不显著,增加样本量降低方差都没有改变结果。如何决策呢?
### 做出决策
由于置信区间不收敛无法根据试验结果决定使用哪个版本。因此需要考虑其他因素做决策。APP整体风格简洁明快没有大色块设计而且醒目的“大色块”并没有带来转化率的提升却将页面分割成上下两个部分。
基于UI样式的考虑我们决定使用版本A。
### 案例思考
试验结果有时会与直觉相左。通过严格试验得出的数据能有效反应用户的真实情况,数据驱动的前提是有数据,有数据的前提是有意识的做试验并收集数据。
很多试验的结果并不能给出明确的决策依据也需要产品经理主观决策这并不意味着试验没有作用试验的作用是将能够用试验验证错误的idea全部排除且证据充分将无法用试验解决的问题交给“专家系统”来决策权即依据负责人或团队的经验决策。
# 总结
今天的核心内容到这里就讲完了,我总结了团队在优化决策模式、推动业务增长过程中积攒的一些经验。
A/B测试方法是经过验证的最佳实践Best Practice要将试验意识写入我们的心智模式每当遇到增长问题、决策问题时第一时间想到“A/B测试可能是一个好的解决方法”这是试验意识的第一个关键点。
试验意识的第二个关键点是A/B测试需要长期坚持要形成循环而不仅仅是闭环。如果说从发现问题到试验结果上线再到效果回归是一个闭环的话那么还需要在发现问题前加一个动词“持续”“持续发现问题”这就让试验意识形成了循环在循环中形成持续向上的趋势。这个意识的重要性不在于一次两次试验有效还是无效而是能让我们在决策前先用试验验证并长期这样做形成习惯。
试验意识的建立,让我们的决策模式不再局限于依赖经验和直觉。试验意识加经验的决策模式成为我们的决策系统,由于这个系统有概率优势,虽然单次决策有时有效有时无效,但长期来看每一次微小进步的叠加效果就能驱动业务的整体增长,而其中的经验必将带来惊艳的效果。

View File

@@ -0,0 +1,61 @@
<audio id="audio" title="结束语|实践是检验真理的唯一标准" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/fe/1b/fe9dbc5a1c32b954ab133d1529c08d1b.mp3"></audio>
你好,我是博伟。
在过去的这些年里我一直在和A/B测试打交道研究的时间越久越能体会出其中蕴含的深意。所以在设计课程大纲时结束语这一讲的标题我毫不犹豫地选择了“实践是检验真理的唯一标准”。这句话很朴素却是我这么多年和A/B测试朝夕相处的真实体会。
首先,我想和你聊聊为什么我在课程中会反复强调实践的重要性。
A/B测试本身就是一种偏经验和方法论的工具。掌握了我在课程中讲的这些统计原理、规范流程后也不能保证你在实践中如鱼得水游刃有余。毕竟**听到的经验和方法,想要深刻理解,还是要拿到实际业务场景中反复试炼,才能不断迭代和完善。**
即使是我讲过的一些常见误区和问题,以及一些隐形的坑点,由于业务环境的千差万别,你在实践时大概率还是会遇到,而且还会遇到其他的坑。不过不要害怕,因为**有些“弯路”非走不可正是在和“弯路”的博弈中你才能摸透A/B测试中的招式和套路精进业务。**
A/B测试带给公司和团队的不光是持续提升的结果更重要的是实验意识。团队中的成员提出一个想法究竟是突发奇想还是真正可靠的呢能不能有效落地实施呢我们完全可以把这个想法通过A/B测试放在实际场景中检验最后得出具有说服力的结论。正所谓**大胆猜想,小心求证,不断调整,快速更迭**。
**“实践”并不是件容易的事儿,真正去做的时候,还需要主动、耐心、有勇气。**
与A/B测试相关的项目都可以主动参与。不管你是亲自做测试还是观摩整个过程这都是在学习积累。主动提出业务需求主动尝试**只要去实践,肯定就有收获。**
**对“失败”多点耐心。**这里的失败我是打引号的你可能会觉得做完A/B测试后只要没有把A/B测试中的变化在产品或业务中实施就算“失败”不过我想告诉你的是从实践数据来看一大半的A/B测试中的变化最终都没有最终实施。在做测试的时候我们肯定希望结果是显著的但实际上不显著的概率比较大。这就是期望与现实的落差。那这就算是失败吗
在A/B测试领域显然不是这样的。每一次“失败”的测试对我们来说都是宝贵的经验你可能会从中发现从而改进测试设置、工程实施等方面的问题。哪怕测试结果真的不显著也没关系因为这也能帮我们排除不同的想法减少给业务带来的潜在损失从而让我们快速迭代到下一个想法中去。
**要敢于提出自己的想法。**我已经记不清有多少次我和同事、领导意见不一致时A/B测试就成了我们解决问题的法宝。长此以往也帮助我们在团队中形成了一种实验的氛围大家越来越敢提出与别人不一样的想法和意见而不是管理人员的一言堂。
你看,“实践是检验真理的唯一标准”中包含的朴素智慧,一旦和我们当下的生活、工作结合起来,是不是就有更生动、更丰富的理解了呢?这也正是我平时爱好历史的原因,前人的智慧总能历久弥新。
不过在今天课程结束之际我还想给你分享更多我自己学习A/B测试的故事聊一聊我的学习心得希望能带给你一些启发和勉励。
**第一个心得,搭建自己的知识框架,能让你的学习效率更高。**
就拿我自己来说吧。我呢,其实并不是科班出身的数据从业者,所以想要在这一陌生领域有立足之地,术业有专攻,就要付出更多的努力。
举个小例子。为了搞清楚中心极限定理、P值、Power这些难懂的统计概念我把各种版本的统计课本学了不下20遍。为了全面掌握数据科学方面的知识就利用业余时间学习了将近10门与数据科学相关的网课。系统化的学习给我打下了实践的坚实基础实践中再遇到其他问题我就知道怎么去搜索资料、寻找解决方法而不会无从下手。
所以这也是我想要做这门课的初衷。根据我多年积累的经验系统总结A/B测试领域的经验和方法帮助想要学习这个领域的人搭建一个知识框架让你能够在短时间内获得非线性的突破。
**第二个心得,学习要有目的,并且要把学到的知识及时应用到实践中,学以致用。**
在学校期间的学习大都是为了学习而学习,工作后的学习就不同了,有目的的学习更能达到一举多得的效果。
我刚才谈到自己曾把统计课本学习了不下20遍这只是相对系统的学习遍数如果算上实际翻看的次数那远不止百次了。因为我这个人呢记性一般纯知识性的东西一旦不常用就很容易忘记。所以统计书对我来说就像小学学习语文时的《现代汉语词典》一样平时用到了就去查形成肌肉动作。
所以如果你学完这个课程有些内容没能完全消化没有关系我希望你能把它当做你在A/B测试上的工具书遇到棘手的问题就来翻看、学习有问题也欢迎继续留言我也会时不时地回复你的问题。
**还想分享一个我做专栏的心得:文字输出是检验输入质量的重要标准。**
在实践中丰富和完善的知识要怎么检验?文字输出就是一个很好的方式。这也是我在做专栏这几个月保持连续输出的一个重要心得。
这几年我会经常带学生做项目或者做讲座,但文字输出和“讲”是不一样的。脑海中把一个问题想清楚了,也能给别人讲出来,但要落到笔上,就得斟酌每一个细枝末节:全文是不是有逻辑、用词是不是够精准、例子是不是够恰当等等。这对文字表达、专业逻辑都是不小的磨练。
做专栏的文字输出,跟我平时写文章也不一样。写专栏文章,我需要去掉那些学术派的语言,调整粗糙的表达,力求用最简单明了的语言去讲清楚一个问题,同时还要考虑读者的阅读习惯等等。所以反复打磨的不仅是文字内容,还有对问题的周密思考。当然了,这对精力、意志力也都是考验。
我和A/B测试已经亲密相处了7年多对我来说它不仅是工作中的一种增长方法在深入体会它的精妙之后它代表的**“实验意识”更成了我生活中的重要理念和原则。**
当生活中偶遇迷茫找不准方向,或者面对未知的不确定心有焦虑时,我不会畏首畏尾,更不会退缩,而是大胆地去尝试。在考虑到可能的结果后,勇于试错。因为不亲自经历,我可能永远也不知道这件事对自己来说是好是坏。
就像过去的2020年注定是个特别的年份突如其来的疫情打乱了很多人在学习、生活和工作上的节奏。在这种生存与挑战、安稳与不确定的摇摆之间不如把**心里的思绪和想法,投放到实践中,从而突破自己内心的围城。**
这也是我最后想与你共勉的:**唯有步履不停,人生路上才能遇到更多的惊喜。**
最后的最后,我也为你准备了[调查问卷](https://jinshuju.net/f/RSZSBZ),题目不多,希望你可以花两分钟填一下。十分期待能听到你的反馈,说说你对这门课程的想法和建议。

View File

@@ -0,0 +1,12 @@
你好,我是博伟。
到这里《A/B测试从0到1》这门课程已经全部结束了。我给你准备了一个结课小测试来帮助你检验自己的学习效果。
这套测试题共有 20 道题目,有单选题,也有多选题,满分 100 分,系统自动评分。
还等什么,点击下面按钮开始测试吧!
[<img src="https://static001.geekbang.org/resource/image/28/a4/28d1be62669b4f3cc01c36466bf811a4.png" alt="">](http://time.geekbang.org/quiz/intro?act_id=361&amp;exam_id=981)
最后,我为你准备了[调查问卷](https://jinshuju.net/f/RSZSBZ),题目不多,希望你可以花两分钟填一下。十分期待能听到你的反馈,说说你对这门课程的想法和建议。