This commit is contained in:
louzefeng
2024-07-11 05:50:32 +00:00
parent bf99793fd0
commit d3828a7aee
6071 changed files with 0 additions and 0 deletions

View File

@@ -0,0 +1,124 @@
<audio id="audio" title="32 | 互联网运营数据指标与可视化监控" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/8c/2d/8c5728863a1066b0a5fc71fcc39bd42d.mp3"></audio>
数据分析是大数据应用的一个主要场景,通过数据分析指标监控企业运营状态,及时调整运营和产品策略,是大数据技术的关键价值之一。互联网企业大数据平台上运行的绝大多数大数据计算都是关于数据分析的,各种统计、关联分析、汇总报告,都需要大数据平台来完成。
下面给你讲一个我曾经遇到过的真实案例。老板跟技术部说,我们要加强监控。技术部以为老板对程序运行监控不满意,这也是情理之中,当对技术人员说监控的时候,他们通常理解的监控就是程序运行期监控,包括操作系统监控和应用程序监控。所以技术部专门挖了做监控的专家,成立了监控运维开发团队,花了半年时间做了一个漂亮的技术运维监控系统。
老板看了以后大惊,这是什么?
你要的监控啊!
啊?
老板蒙掉了。
老板其实想要的是运营监控就是我下面要列举的那些运营数据指标他需要全面快速了解这些指标以发现公司运营中出现的问题。而技术部却给了他一个监控系统响应时间、执行超时、CPU利用率的监控系统。
从公司角度看,运营数据是公司运行发展的管理基础,既可以通过运营数据了解公司目前发展的状况,又可以通过调节这些指标对公司进行管理,即数据驱动运营。
而运营数据的获得需要在应用程序中大量埋点采集数据从数据库、日志和其他第三方采集数据对数据清洗、转换、存储利用SQL进行数据统计、汇总、分析才能最后得到需要的运营数据报告。而这一切都需要大数据平台的支持。
## 互联网运营常用数据指标
不同的互联网行业关注不同的运营数据,细化来看,复杂的互联网产品关注的运营指标成百上千。但是有一些指标是我们最常用的,这些指标基本反映了运营的核心状态。
**1. 新增用户数**
新增用户数是网站增长性的关键指标指新增加的访问网站的用户数或者新下载App的用户数对于一个处于爆发期的网站新增用户数会在短期内出现倍增的走势是网站的战略机遇期很多大型网站都经历过一个甚至多个短期内用户暴增的阶段。新增用户数有日新增用户数、周新增用户数、月新增用户数等几种统计口径。
**2. 用户留存率**
新增的用户并不一定总是对网站App满意在使用网站App后感到不满意可能会注销账户卸载App这些辛苦获取来的用户就流失掉了。网站把经过一段时间依然没有流失的用户称作留存用户留存用户数比当期新增用户数就是用户留存率。
```
用户留存率 = 留存用户数 / 当期新增用户数
```
计算留存有时间窗口即和当期数据比3天前新增用户留存的称作3日留存相应的还有5日留存、7日留存等。新增用户可以通过广告、促销、病毒营销等手段获取但是要让用户留下来就必须要使产品有实打实的价值。用户留存率是反映用户体验和产品价值的一个重要指标一般说来3日留存率能做到40%以上就算不错了。和用户留存率对应的是用户流失率。
```
用户流失率 = 1 - 用户留存率
```
**3. 活跃用户数**
用户下载注册但是很少打开产品表示产品缺乏黏性和吸引力。活跃用户数表示打开使用产品的用户数根据统计口径不同有日活跃用户数、月活跃用户数等。提升活跃是网站运营的重要目标各类App常用推送优惠促销消息给用户的手段促使用户打开产品。
**4. PV**
打开产品就算活跃打开以后是否频繁操作就用PV这个指标衡量用户每次点击每个页面跳转被称为一个PVPage View。PV是网页访问统计的重要指标在移动App上需要进行一些变通来进行统计。
**5. GMV**
GMV即成交总金额Gross Merchandise Volume是电商网站统计营业额流水、反映网站营收能力的重要指标。和GMV配合使用的还有订单量用户下单总量、客单价单个订单的平均价格等。
**6. 转化率**
转化率是指在电商网站产生购买行为的用户与访问用户之比。
```
转化率 = 有购买行为的用户数 / 总访问用户数
```
用户从进入网站App到最后购买成功可能需要经过复杂的访问路径每个环节都有可能会离开进入首页想了想没什么要买的然后离开搜索结果看了看不想买然后离开进入商品详情页面看看评价、看看图片、看看价格然后离开放入购物车后又想了想自己的钱包然后离开支付的时候发现不支持自己喜欢的支付方式然后离开…一个用户从进入网站到支付完成一笔真正的消费中间会有很大概率流失网站必须要想尽各种办法个性化推荐、打折促销、免运费、送红包、分期支付以留住用户提高转化率。
以上是一些具有普适性的网站运营数据指标,具体到不同的网站根据自身特点,会有自己的指标。比如百度可能会关注“广告点击率”这样的指标,游戏公司可能会关注“付费玩家数”这样的指标。每个产品都应该根据自身特点寻找能够反映自身运营状况的数据指标。
为了便于分析决策,这些指标通常会以图表的方式展示,即数据可视化。
## 数据可视化图表与数据监控
数据以图表方式展示,可以更直观展示和发现数据的规律,互联网运营常用可视化图表有如下几种。
**1. 折线图**
折线图是用得最多的可视化图表之一,通常横轴为时间,用于展示在时间维度上的数据变化规律,正向指标(比如日活跃用户数)斜率向上,负向指标(比如用户流失率)斜率向下,都表示网站运营日趋良好,公司发展欣欣向荣。
<img src="https://static001.geekbang.org/resource/image/b1/39/b1c7cdce159fb7d3ddf7d8cd8a4f7939.png" alt="">
**2. 散点图**
数据分析的时候,散点图可以有效帮助分析师快速发现数据分布上的规律与趋势,可谓肉眼聚类算法。
<img src="https://static001.geekbang.org/resource/image/c1/e9/c1134228db24e0940d0ff2918a4ccbe9.png" alt="">
**3. 热力图**
热力图用以分析网站页面被用户访问的热点区域,以更好进行页面布局和视觉展示。
<img src="https://static001.geekbang.org/resource/image/e3/5d/e32afcea36d34868a8719ef6929f5a5d.jpg" alt="">
在地图上展示的热力图则表示了该地区的拥堵和聚集状态,方便用户进行出行规划。
<img src="https://static001.geekbang.org/resource/image/4f/f1/4f7527a7ba4ade9a6b5fdc38514782f1.png" alt="">
**4. 漏斗图**
漏斗图可谓是网站数据分析中最重要的图表表示在用户的整个访问路径中每一步的转化率。当重要的营收指标GMV、利润、订单量发生异常的时候就必须要对整个的漏斗图进行分析判断是网站的入口流量发生了问题还是中间某一步的转化发生了问题是内容的问题还是系统的问题需要逐个进行分析排查。除了发现提升网站运营效率的关键点与方法分析找出异常问题的根源也是数据分析最重要的工作之一。
<img src="https://static001.geekbang.org/resource/image/6a/a3/6a0995daa118a3971e029c31520c0da3.png" alt="">
此外还有柱状图、饼图等,也经常用于数据分析和展示。可视化图形在数据分析时可以帮助分析师更准确、更快速做出趋势预判并发现问题,在汇报工作时使用图表更有说服力,决策时也更有依据和信心。俗话说得好,“一图胜千言”,多掌握一些图表技巧可以使工作中很多事情事半功倍。
以上示例用的图表都来自于[ECharts](http://echarts.baidu.com)。ECharts百度开源的一个前端可视化图表组件使用这个组件只需要几行代码就可以将运营数据以炫酷的方式可视化展示出来。
## 小结
大数据技术最终落地必须要为企业带来实际价值,数据分析是其中最主要的应用场景之一。分析结果是最终的成果展示,在此之前,数据的采集、清洗、转换、存储、计算、分析,需要大量的工作。既然已经做了这么多工作,如何将最终的工作成果包装得更加直观、有科技感,技术人员需要换位思考,从用户角度、非技术角度去思考,争取让自己的工作更得到认可,实现更大价值。
很多互联网公司都有监控大屏,一个目的是做展示用,在公司显眼的位置放一个大屏幕,显示主要的运营指标和实时的业务发生情况,给公众和参观者展示直观的公司商业运营情况。比如天猫每年双十一的时候,都会通过大屏幕直播实时购物数据。
<img src="https://static001.geekbang.org/resource/image/c3/f7/c3e4cd48d94d083628f738c129db34f7.jpg" alt="">
监控大屏的另一个目标就是实时展示业务运营状况,让我们对自己的工作成绩一目了然。如果数据突然出现波动,相关人员也可以快速响应,排查是技术问题还是运营市场问题,实现快速分析、快速解决。
## 思考题
对于今天文章开头提到的案例,如果换作你,老板跟你说,我们需要一个更强大、快速的监控系统的时候,你该如何回应?
如果最后老板明确要的就是我们今天讨论的运营数据监控系统,你该如何推动这件事情的落实?
欢迎你点击“请朋友读”,把今天的文章分享给好友。也欢迎你写下自己的思考或疑问,与我和其他同学一起讨论。

View File

@@ -0,0 +1,91 @@
<audio id="audio" title="33 | 一个电商网站订单下降的数据分析案例" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/77/81/776941476d95b080cd73a2aa42867d81.mp3"></audio>
企业运营的数据可以让管理者、运营人员、技术人员全面、快速了解企业的各项业务运行的状况,并发现公司可能出现的经营问题,进而能通过这些指标进行详细分析,最后定位问题的原因,并找到解决的办法。
今天我们一起通过一个案例,来看看如何通过数据分析追踪并解决问题。
## 数据分析案例
X网站是一家主营母婴用品的电商网站网站运营多年是该领域的领头者之一各项数据指标相对比较稳定。运营人员发现从8月15日开始网站的订单量连续四天明显下跌。由于受节假日、促销、竞争对手活动等影响日订单量有所起伏是正常现象所以前两天8.15、8.16)运营人员并没有太在意。
但是8月18号早晨发现8月17号的订单量并没有恢复到正常水平运营人员开始尝试寻找原因是否有负面报道被扩散是否竞争对手在做活动是否某类商品缺货、价格异常但是并没有找到原因。并且第二天发现订单量依然没有恢复正常于是将问题提交给数据分析团队作为最高优先级成立数据分析专项小组进行分析。
<img src="https://static001.geekbang.org/resource/image/bd/81/bd5c51c805f28b35222314126207c881.png" alt="">
你从上图可以看到8月15日开始订单量明显下滑。
数据分析师第一反应是网站新增用户出现问题,因为历史上出现过类似比例的订单量下跌,当时查找到的原因是,网站的主要广告推广渠道没有及时续费,广告被下架,新增用户量明显下滑导致订单量下降。数据分析师拉取了同期的新增用户量数据,发现新增用户并没有明显下降,如下图所示。
<img src="https://static001.geekbang.org/resource/image/10/0e/1011a21bfa6c536936672737739f210e.png" alt="">
拉出同期的日活数据查看,发现日活数据也没有明显下降,便做出基本判断:用户在访问网站的过程中,转化出了问题。
和一般的电商网站类似X网站的常规转化过程也是用户打开App搜索关键词查找想要的商品浏览商品搜索结果列表点击某个商品查看该商品的详细信息如果有购买意向可能会进一步咨询客服人员然后放入购物车最后对购物车所有商品进行支付产生有效订单。X网站的转化漏斗如下。
<img src="https://static001.geekbang.org/resource/image/33/e8/33c1d854f4186d503891649e224a73e8.png" alt="">
如果定义打开App为活跃那么网站的整体转化就是活跃到订单的转化公式为
```
订单活跃转化率 = 日订单量 / 打开用户数
```
显然从15号开始这个转化率开始下降但转化过程有多个环节那么具体是哪个环节出了问题呢数据分析师对转化过程每个环节计算转化率。例如
```
搜索打开转化率 = 搜索用户数 / 打开用户数
```
以此类推,每个环节都可以计算其转化率,将这些转化率的近期历史数据绘制在一张折线图上,就可以看到各个环节转化率的同期对比视图。
<img src="https://static001.geekbang.org/resource/image/c4/93/c4f561efd2d19751129efb9a8f7d4d93.png" alt="">
由于比例关系图中可能不太明显但是还是可以看出有明显降幅的是咨询详情转化率最下方折线降幅接近10%。调查客服也没有发现异常情况进一步对咨询信息分类统计后发现新用户的咨询量几乎为0明显不合常理。
数据分析师自己注册了一个新用户然后发起咨询没有得到回复。查询后台发现咨询信息没有到达客服。于是将问题提交给技术部门调查工程师查看8月15日当天发布记录发现有消息队列SDK更新而咨询信息是通过消息队列发给客服的。进一步调查发现是程序bug新用户信息构建不完整导致消息发送异常。
最后紧急修复bug发布上线第二天订单量恢复正常。
>
该案例为虚构案例,仅用于数据分析过程演示。
## 数据分析方法
辩证唯物主义告诉我们,这个世界是普遍联系的,任何事物都不是孤立存在的。所以当出现运营数据异常的时候,引起异常的原因可能有很多,越是根本性的问题,越是有更多引起问题的可能,如何进行数据分析,其实并不是一件简单的事。
数据分析中,有一种金字塔分析方法。它是说,任何一个问题,都可能有三到五个引起的原因,而每个原因,又可能有三到五个引起的子原因,由此延伸,组成一个金字塔状的结构。我们可以根据这个金字塔结构对数据进行分析,寻找引起问题的真正原因。
上面案例中一开始运营人员自己寻找订单量下降原因的时候,其实就用了金字塔分析方法。
<img src="https://static001.geekbang.org/resource/image/d1/15/d1665eb4df5c09166d48eb93c3b6e515.png" alt="">
金字塔分析方法可以全面评估引起问题的各种原因,但是也可能会陷入到太过全面,无从下手或者分析代价太大的境况。所以要根据经验和分析,寻找主要原因链路。绝大多数互联网产品的主要原因链路就在转化漏斗图上,上面案例中,数据分析师的分析过程,基本就集中在转化漏斗上。
我曾经看过某独角兽互联网公司的数据运营指导文件,对于几个关键业务指标的异常必须要及时通知高管层,并在限定时间内分析异常原因。而指导分析的链路点,基本都在转化漏斗图上,只不过因为入口渠道众多,这样的分析链路也有很多条。
这种金字塔方法不仅可以用于数据分析过程,在很多地方都适用,任何事情都可以归纳出一个中心点,然后几个分支点,每个分支点又有几个子分支。构建起这样一个金字塔,对于你要表达的核心观点,或者要学习知识,都可以有一个清晰的脉络,不管是和别人交流,还是自己思考学习,都很有帮助。
上面画的金字塔分析图其实就是思维导图,我的大数据专栏的知识点也可以用金字塔方法描述。
<img src="https://static001.geekbang.org/resource/image/d4/11/d4ad054351a04066650bd15d2dc28d11.png" alt="">
人如何进行高效的思考,一方面是天分,一方面可以通过训练提高。我见过最厉害的人,他的思考过程如飞鸿掠影,不留痕迹;讨论问题的时候,往往只描述清楚问题,还没展开讨论,他就能直指问题的根源,其他人再争论半天,才发现确实如他所言。还有一种人,他会详细分析各种可能的原因,排查、分析、否定各种可能,最后找到问题的结症。因为过程严谨、思路清晰,所以通常也能解决真正的问题。
前一种,我想大概主要靠天分,而后一种,其实就是使用金字塔方法。但是在实际中,我却经常见到第三种情况:没有前一种的天分,也不愿付出后一种的努力,思考过程天马行空,抓不住重点,找不到突破口,越想越乱,越思考越糊涂。其实,金字塔方法并不难掌握,只要用心学习、训练,每个人都可以学会这种思考方法。
## 小结
数据分析是大数据最主要的应用场景,很多企业所谓的大数据其实就是大数据分析,而大数据分析也确实能够对企业管理和运营起到积极的推进作用。而企业的管理、产品、技术过程中的各种决策、外部市场环境的变化,也都会在数据上反映出来。关注数据分析,抓住数据,就能抓住企业运行的关键。而企业在运营过程中出现的问题,也可以通过数据分析定位,发现引起问题的原因,并从根本上解决问题。
前面专栏有同学留言说“我在公司做大数据多年,现在大数据平台已经稳定,数据量和业务都没有太大变化,工作重复,也没有什么进步,不知道下一步该怎么走”。我建议技术人员可以有更开阔的视野,不要仅仅给自己定位就是一个写代码的,比如也可以尝试去做一些数据分析,拥有数据思维、产品思维、商业思维,然后不管你还是想继续写代码,还是就此发现了自己新的天赋点,你的思路和人生之路都会更加开阔。
## 思考题
学习和工作计划也可用思维导图来完成,总目标、子目标,可以逐级分解,最后每个小目标都可以用几周甚至几天完成。这样,当绝大多数小目标完成了,今年的大目标也就完成了。在专栏的“[新年寄语](http://time.geekbang.org/column/article/75682)”中,很多同学都留言写下自己的新年目标和期望,你能否用思维导图将这个目标分解成一个金字塔结构呢?
欢迎你点击“请朋友读”,把今天的文章分享给好友。也欢迎你写下自己的思考或疑问,与我和其他同学一起讨论。

View File

@@ -0,0 +1,59 @@
<audio id="audio" title="34 | A/B测试与灰度发布必知必会" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/09/6b/09fb207e4d0224065b2d6ab02b826e6b.mp3"></audio>
在网站和App的产品设计中经常会遇到关于哪种产品设计方案更优的思考和讨论按钮大一点好还是小一点好页面复杂一点好还是简单一点好这种蓝色好还是另一种蓝色好新的推荐算法是不是真的效果好…这种讨论会出现在运营人员和产品经理之间也会出现在产品经理和工程师之间有时候甚至会出现在公司最高层成为公司生死存亡的战略决策。
在Facebook的发展历史上曾经多次试图对首页进行重大改版甚至有时候是扎克伯格亲自发起的改版方案但是最终所有的重大改版方案都被放弃了多年来Facebook基本保持了一贯的首页布局和风格。
相对应的是一直被认为抄袭Facebook的人人网在Facebook多次改版举棋不定的时候毅然进行了重大的首页改版摆脱了长期被诟病的抄袭指责。但是讽刺的是事后回头再看伴随着人人网改版的是用户的快速流失并最后导致了人人网的没落而Facebook的守旧却保证了Facebook的持续发展。
让Facebook放弃改版决定的正是Facebook的A/B测试。Facebook开发出新的首页布局版本后并没有立即向所有用户发布而是随机选择了向大约1%的用户发布即这1%的用户看到的首页是新版首页,而其他用户看到的还是原来的首页。过一段时间后观察两部分用户的数据指标,看新版本的数据指标是否好于旧版本。
事实上Facebook观察到的结果可不乐观新版本的用户数据指标呈下跌状态。扎克伯格不甘心要求继续放大新版测试用户的比例运营团队一度将新版测试用户的比例放大到16%,但是数据显示新版并不受用户欢迎,数据指标很糟糕。最后扎克伯格决定放弃新版,首页维持原来布局。
A/B测试是大型互联网应用的常用手段。如果说设计是主观的那么数据是客观的与其争执哪种设计更好、哪种方案更受用户欢迎不如通过A/B测试让数据说话。如果人人网当初认真做A/B测试也许不会贸然改版据说今日头条为了论证两条新闻之间的分割究竟应该用多宽的距离同样是做了数百组A/B测试。
所以A/B测试是更精细化的数据运营手段通过A/B测试实现数据驱动运营驱动产品设计是大数据从幕后走到台前的重要一步。
## A/B测试的过程
A/B测试将每一次测试当作一个实验。通过A/B测试系统的配置将用户随机分成两组或者多组每组用户访问不同版本的页面或者执行不同的处理逻辑即运行实验。通常将原来产品特性当作一组即原始组新开发的产品特性当作另一组即测试组。
经过一段时间几天甚至几周以后对A/B测试实验进行分析观察两组用户的数据指标使用新特性的测试组是否好于作为对比的原始组如果效果比较好那么这个新开发的特性就会在下次产品发布的时候正式发布出去供所有用户使用如果效果不好这个特性就会被放弃实验结束。
<img src="https://static001.geekbang.org/resource/image/14/98/143f62d32673e1a633d2441969c41c98.png" alt="">
对于一个大型网站通常都会开发很多新产品特性其中很多特性需要进行A/B测试所以在进行流量分配的时候每个特性只会分配到比较小的一个流量进行测试比如1%。但是由于大型网站总用户量比较大即使是1%的用户实验得到的数据也具有代表性了。Facebook拥有几十亿用户如果A/B测试的新特性对用户不友好那么即使只测试1%的用户也有几千万用户受到影响。所以在进行A/B测试时对实验流量和特性的选择也要谨慎对待。
## A/B测试的系统架构
A/B测试系统最重要的是能够根据用户ID或者设备ID将实验配置参数分发给应用程序应用程序根据配置参数决定给用户展示的界面和执行的业务逻辑如下图。
<img src="https://static001.geekbang.org/resource/image/b2/45/b22e091c7d4ee1572703dc740b89d245.png" alt="">
在实验管理模块里进行用户分组比如测试组、原始组并指定每个分组用户占总用户的百分比流量分配模块根据某种Hash算法将用户设备分配到某个实验组中一个实验可以有多个参数每个组有不同的参数值。
移动App在启动后定时和A/B测试系统通信根据自身用户ID或者设备ID获取自己参与的A/B测试实验的配置项根据配置项执行不同的代码体验不同的应用特性。应用服务器和A/B测试系统在同一个数据中心获取实验配置的方式可以更灵活。
移动App和应用服务器上报实验数据其实就是传统的数据采集但是在有A/B测试的情况下数据采集上报的时候需要将A/B测试实验ID和分组ID也上报然后在数据分析的时候才能够将同一个实验的不同分组数据分别统计得到A/B测试的实验数据报告。
## 灰度发布
经过A/B测试验证过的功能特性就可以发布到正式的产品版本中向所有用户开放。但是有时候在A/B测试中表现不错的特性正式版本发布后效果却不好。此外A/B测试的时候每个功能都应该是独立正交正式发布的时候所有的特性都会在同一个版本中一起发布这些特性之间可能会有某种冲突导致发布后的数据不理想。
解决这些问题的手段是灰度发布,即不是一次将新版本发布给全部用户,而是一批一批逐渐发布给用户。在这个过程中,监控产品的各项数据指标,看是否符合预期,如果数据表现不理想,就停止灰度发布,甚至进行灰度回滚,让所有用户都恢复到以前的版本,进一步观察分析数据指标。
灰度发布系统可以用A/B测试系统来承担创建一个名叫灰度发布的实验即可这个实验包含这次要发布的所有特性的参数然后逐步增加测试组的用户数量直到占比达到总用户量的100%,即为灰度发布完成。
灰度发布的过程也叫作灰度放量灰度放量是一种谨慎的产品运营手段。对于Android移动App产品而言因为国内存在很多个应用下载市场所以即使没有A/B测试系统也可以利用应用市场实现灰度发布。即在发布产品新版本的时候不是一次在所有应用市场同时发布而是有选择地逐个市场发布。每发布一批市场观察几天数据指标如果没有问题继续发布下一批市场。
## 小结
A/B测试的目的依然是为了数据分析因此通常被当作大数据平台的一个部分由大数据平台团队主导联合业务开发团队和大数据分析团队合作开发A/B测试系统。A/B测试系统囊括了前端业务埋点、后端数据采集与存储、大数据计算与分析、后台运营管理、运维发布管理等一个互联网企业几乎全部的技术业务体系因此开发A/B测试系统有一定难度。但是一个良好运行的A/B测试系统对企业的价值也是极大的甚至可以支撑起整个公司的运营管理我们下期会详细讨论。
## 思考题
A/B测试需要在前端App根据实验分组展示不同界面、运行不同业务逻辑你有没有比较好的设计方案或者技术架构可以更灵活、对应用更少侵入地实现这一功能
欢迎你点击“请朋友读”,把今天的文章分享给好友。也欢迎你写下自己的思考或疑问,与我和其他同学一起讨论。

View File

@@ -0,0 +1,89 @@
<audio id="audio" title="35 | 如何利用大数据成为“增长黑客”?" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/71/03/7154f4da8c54eb53feee21bd2a3e4003.mp3"></audio>
增长黑客是近几年颇为流行的一个词汇它是指利用数据、技术、产品等一系列手段为互联网产品获得快速用户增长的人。互联网的访问没有边界用户量的增加对应成本的增加也几乎可以忽略不计所以如何快速、大规模获取用户是互联网产品的成功之道我们所熟知的成功的互联网公司例如国内的BAT、国外的FLAG都拥有数亿甚至数十亿的用户。
你有没有曾经幻想过“如果全国人民每人给我一块钱,我就成了亿万富翁”?事实上,这种想法并不天真,在互联网时代,你只要让全国人民都知道你,你肯定就能成为亿万富翁。因为我们处在一个注意力和流量可以变现的时代,支付宝在微博上随机抽取一个“锦鲤”,这个人瞬间就能得到全国人民的关注,然后就能财富自由周游世界了。还有那些拥有数百万粉丝的网红,年收入一般都能上百万。所以我们看到,在微博、在快手、在抖音,很多人费尽心机求关注、求点赞,因为这些关注和点赞最后都能变现为财富。
互联网产品也一样如果你能拥有大量的用户你就成功了。所以我们看到互联网公司特别是初创互联网公司为了获得用户为了用户数量增长可以说是费尽心机。淘宝在成立的时候马云给淘宝管理团队的指示是“不要赚钱”。那么不要赚钱要什么答案是要用户要增长。所以淘宝2003年成立到2009年一直在亏损但是用户量在飞速增长后面开始盈利以后就仿佛开启了印钞机赚得盆满钵满。
那么如何才能获得用户呢?传统的做法是打广告,在各种媒体进行曝光,向用户推销自己的产品。但是这种方法投入大、见效慢,不能满足互联网产品的增长要求,互联网产品必须利用自己的特点寻求不一样的增长之道,这就是增长黑客这一互联网特有的角色出现的背景。下面我给你讲一个“增长黑客”的传奇故事。
## Hotmail的增长黑客故事
Hotmail是两个工程师的创业项目他们用网页方式提供电子邮箱服务而当时其他的电子邮箱都需要安装客户端才能使用因此他们的产品很创新技术也很先进对用户也很有价值。但是问题是如何才能把这么好的产品推广给使用电子邮件的目标人群呢传统推广渠道不合适一来是两人没那么多钱二来是传统媒体的用户也不是电子邮件的用户。关于如何寻找目标用户如何向他们推广Hotmail邮箱两人想来想去最后想出一个绝妙的主意他们在用户使用Hotmail发送的每一封邮件的结尾处附了一行字“我爱你快来Hotmail申请你的免费邮箱”。
这一很小的改动产生了戏剧性的效果Hotmail像病毒一样开始传播仅仅几个小时后Hotmail用户数就开始快速增长。六个月的时间Hotmail获得了100万的用户然后只用了五周的时间又获得了100万用户。就这样Hotmail用了一年多的时间让当时全球20%的网民成为自己的用户数量大约是1500万。后面的故事我们就很熟悉了Hotmail被“巨头”微软收购。
现在距离Hotmail创业已经过去20多年了互联网产业也进入了“下半场”简单复制Hotmail的做法很难再现奇效但是综合利用大数据、智能推荐、病毒营销等一系列手段依然能够创造奇迹典型的案例就是拼多多。拼多多于2015年成立那时人们普遍认为电商的互联网格局已经形成后来者的机会已经不多了。但是就是在这样的情况下拼多多只用了两年时间订单量就超过了京东成立三年完成上市让京东、淘宝等电商巨头寝食难安。
## AARRR用户增长模型
关于用户增长有一个著名的AARRR模型它描述了用户增长的5个关键环节分别是获取用户Acquisition、提高活跃度Activation、提高留存率Retention、获取收入Revenue和自传播Refer
<li>
获取用户:通过各种推广手段,使产品触达用户并吸引用户,让用户访问我们的产品。
</li>
<li>
提高活跃度:用户访问我们的产品后,如果发现没意思、体验差,就很难再次打开,产品的价值也就无法实现。因此需要结合产品内容、运营活动各种手段吸引用户,提升产品的活跃度。
</li>
<li>
提高留存率:留住一个老用户的成本远低于获取一个新用户,而真正为产品带来营收利润的通常是老用户,因此需要提高留存率。提高留存率的常用手段有:针对老用户推出各种优惠和活动;建立会员等级体系,注册时间越长等级越高;对于一段时间没有访问的疑似流失用户进行消息短信推送以实现用户挽回等。
</li>
<li>
获取收入:做企业不是做慈善,开发、运营互联网产品的最终目的还是为了赚钱,即获取收入。互联网产品收入主要有用户付费和广告收入,有些互联网产品看起来是用户付费,但其实主要营收是广告收入,比如淘宝。
</li>
<li>
自传播:让用户利用自己的社交网络进行产品推广就是自传播,几乎所有的互联网产品都有“分享到”这样一个功能按钮,促进用户社交传播。有些产品还会利用“帮我砍价”“帮我抢票”等产品功能推动用户进行分享,实现产品的裂变式传播、病毒式营销。
</li>
我还以拼多多为例一起看看拼多多如何利用AARRR模型实现用户快速增长。
<li>
拼多多是近几年互联网产品中将**自传播**发挥到极致的一个产品。拼多多用户群体主要为三四线以下城市人群,社交成本比较低,愿意为了砍几块钱发动自己的各种社交资源,因此拼多多就利用“帮好友砍价”这一功能实现产品的快速裂变传播。事实上,拼多多非常准确地抓住了这一群体的社交痛点:交往不多的朋友,与其尬聊维持友谊,不如帮我砍价来得更实惠更亲密。
</li>
<li>
自传播也是拼多多主要**获取用户**的手段。比如帮好友砍价时拼多多会提示“下载App可以帮好友砍更多价”于是用户量呈指数级增长。
</li>
<li>
拼多多为了让新来的用户快速上手、增加**活跃度**,用户第一次使用拼多多的时候,并不需要注册登录,直接就可以挑选商品和购买,在后面订单环节再让用户注册,这时用户已经产生购买冲动,进行注册也更容易被接受。
</li>
<li>
拼多多通过各种消息推送促使用户打开App或者微信小程序并在开屏页面的优惠信息给用户制造惊喜达到**留存**用户的目的。
</li>
<li>
拼多多的主要交易模式为拼团,拼团属于冲动型购买,拼多多为了减少用户的思考时间、维持购买冲动,将购买路径设计得尽可能短,使用户可以尽快完成付费,企业**获取收入**。
</li>
## 利用大数据增长用户数量
AARRR增长模型的各个环节其实都离不开大数据的支持具体是利用大数据分析和计算增长用户的手段主要有
<li>
利用用户画像进行精准广告获客。比如微信朋友圈的广告,通过对用户微信数据的分析进行用户画像。投放广告的时候,可以精确使用用户标签进行广告投放,获取到有效的客户,即所谓的广告选人。
</li>
<li>
通过用户分析挽回用户。我在前面说过互联网产品的用户留存很难超过40%,对于流失用户,可以通过短信、推送等手段进行挽回,比如根据用户注册信息,推送用户感兴趣的商品、折扣券、红包等信息,重新激活用户。留存用户由于某些原因也会再次流失或者沉默,通过用户价值分析和流失原因分析,也可以进一步采用各种运营策略挽回用户。
</li>
<li>
A/B测试决定产品功能。新功能通过A/B测试进行数据分析分析是否对用户留存、购买转化等关键指标有正向作用以此决定是否上新功能。
</li>
<li>
大数据反欺诈、反羊毛。互联网产品在拉新或提高留存的过程中,会有很多促销手段,但是这些促销手段会吸引来专业的“羊毛党”,他们会注册大量虚假账号,然后领取红包,使企业的促销资源无法投放到真正的用户手中。此时可以通过历史数据、用户点击行为分析等大数据技术,有效识别出“羊毛党”。
</li>
<li>
用户生命周期管理。一个互联网产品的用户会经历获取、提升、成熟、衰退、离网几个阶段,用户在不同的生命周期阶段会有不同的诉求,通过数据分析对用户进行分类,可以有针对性的运营,进一步提升用户的留存和转化。
</li>
上面提到的推荐、用户画像等都属于大数据算法的技术范围,我们会在下个模块进一步讨论。
## 小结
今天我给你讲了增长黑客以及他们所关注的增长模型,对于应用大数据技术帮助产品提高增长,主要就是利用大数据分析发现产品运营中的各种规律,然后用大数据算法针对特定的用户提供各种个性化的服务,以实现产品的用户增长、营收增长,最终将企业做大做强。
互联网进入下半场以前那种产品OK、团队给力就可以野蛮、快速增长的时代已经过去了。现在用户增长的各个环节都需要进行精细化运营才能在竞争中获得优势而精细化运营则必须依赖海量的用户、商品、行为数据才能完成这都是大数据技术的用武之地。
## 思考题
你还了解其他的互联网产品用户增长的手段吗?可否举几个你用过或者熟悉的具体例子?
欢迎你点击“请朋友读”,把今天的文章分享给好友。也欢迎你写下自己的思考或疑问,与我和其他同学一起讨论。

View File

@@ -0,0 +1,83 @@
<audio id="audio" title="36 | 模块答疑:为什么说数据驱动运营?" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/da/f0/da081c86219a249384394dba1311a7f0.mp3"></audio>
你好,我是李智慧。在讲今天“数据驱动运营”这个话题前,我必须先铺垫两句。
当我们谈论大数据的时候我们究竟在谈什么是谈Hadoop、Spark这样的大数据技术产品还是谈大数据分析、大数据算法与推荐系统这样的大数据应用其实这些都是大数据的工具和手段**大数据的核心就是数据本身**。数据就是一座矿山,大数据技术产品、大数据分析与算法是挖掘机、采矿车,你学了大数据,每天开着矿车忙忙碌碌,那你只是一个矿工,可能每天面对一座金山却视而不见。
数据比代码的地位要高得多,用途也大得多,做大数据的同学要意识到数据的重要性。数据的作用是无处不在的,不但能做统计分析、精准营销、智能推荐,还能做量化交易帮你自动赚钱,甚至能驱动公司运营,管理整个公司。今天这篇答疑就是想把数据的地位认识拔高一些,让你知道自己学大数据究竟能做什么。
关于中国互联网三巨头BAT百度、阿里巴巴、腾讯的企业组织与管理江湖上有一种常见的说法是百度是技术驱动的阿里巴巴是运营驱动的腾讯是产品驱动的。
也就是说,百度的公司增长与进步主要是通过工程师的技术创新实现的,工程师在技术上有所突破和创新后,调动公司产品、运营,甚至公关、法务方面的资源进一步扩大占领市场。工程师在公司拥有优势地位,在公司内能整合各方资源,驱动公司发展与进步。
相对应的,在阿里巴巴,运营人员拥有核心地位,马云的战略决策和运营指标下达给运营人员,运营人员千方百计通过各种手段,主要是产品和技术手段,完成运营指标,实现公司战略。在淘宝,所有员工都自称“小二”,站在运营角度开展工作,通过运营整合公司资源,驱动公司进步。
而在腾讯,公司的发展壮大则主要靠产品取胜,产品经理思考用户体验和产品特性,耐心打磨自己的产品,让用户在使用过程中被产品吸引,扩大产品的市场占有率。腾讯的核心人物马化腾和张小龙都称自己为产品经理,公司资源也围绕产品展开。
BAT作为业界翘楚在成长过程中逐渐摸索出适合自身的组织管理和内部驱动方式但是更多的互联网企业包括一些知名的互联网企业还没有找到科学的管理方式。这其中发展好一点的企业通常采用一种叫作“老板驱动型”的管理方式老板事无巨细亲自关心业务员工一旦没有老板的指示就茫然失措不知道自己该干什么。而差一点的企业则会进入到一种“老板也不知道怎么驱动型”的管理状态大家忙忙碌碌却像是在做布朗运动不但不能进步甚至连个像样的失败都没有。
一般的互联网企业的组织方式是下面这样的。
<img src="https://static001.geekbang.org/resource/image/27/ae/275b08245e59193029b209a7e6ebdbae.jpg" alt="">
通常的工作模式是:首先,老板有个想法,或者运营有个点子,又或者市场有个反馈;然后运营人员把这个想法、点子、反馈变成一个业务需求提交给产品团队;接着产品经理和设计师进行需求分析、产品设计,将产品需求提给技术团队;最后工程师将这些功能开发完成,发布上线供用户使用。
<img src="https://static001.geekbang.org/resource/image/e9/3f/e9325ea835a4be06a73e8d9ea619143f.jpg" alt="">
一个点子从提出到开发上线,通常需要数周乃至数月的工作量;而开发资源一般总是紧缺的,产品需求需要进行开发排期,短则数天、长则数月。因此一个业务需求从提出到上线,要经过较长一段时间。往往工程师加班加点开发了一个新功能,上线以后这个功能的提出者已经失去了提出时的激情,甚至已经忘了这个功能。没有后续的推广运营,没有进一步的迭代增强,这个新功能就变成产品的一个“鸡肋”,直至无人问津。
大多数互联网企业保守估计的话至少80%的业务需求没有实现最初期望的价值相当一部分功能甚至完全没有起任何作用。5个工程师开发3周的红包功能最后只有两个用户领取3个工程师开发一个月的活动小游戏只有区区几百个点击…这样的事例在现实中不胜枚举。
导致这个现象的一个原因是整个工作流程缺乏反馈,运营不断提需求,产品不断做设计,工程师忙着“搬砖”,自己做的工作对公司业务有多大价值却缺乏思考,为了工作而工作。除非有个头脑敏捷又精力旺盛的老板在其中不断干预,各个环节全方位参与,否则公司就会进入一种忙忙碌碌却没有进步的境地。而且即使有这样的老板,这样的公司也很难做大。
说了那么多问题,我们的目标还是要解决它。一个解决办法是引入业务数据监控,在提出一个新需求时,需要对价值进行预估:这个新功能可以有多少点击,可以提高多少留存、多少转化,对预期价值进行量化。产品和开发需要知道预期价值,如果对价值有疑惑,可以提出质疑,多方一起讨论,对需求进行完善。新功能上线后,对新功能的业务指标进行持续监控,检验是否达到当初的预期;如果没有,提出后续改进的措施。
<img src="https://static001.geekbang.org/resource/image/7f/33/7f6c464745cea507bd27b97f342b0d33.jpg" alt="">
从上面的图中你可以看到,通过业务数据的反馈从而使公司的工作流程变成一个闭环,用户数据会成为运营团队想法策略的重要输入,工作目标和团队协作围绕数据展开。老板只需要对数据提出合理的目标和期望,就可以驱动团队有效运作,使团队之间的合作或竞争都集中在实现公司商业价值这个根本目的上来。
因为数据是内部公开的,所有人都能看到,也迫使运营人员必须在提出需求时慎重思考,发布上线后持续跟进,尽力保证自己提出的预期指标能够实现;而不是想起一出是一出,决策时不审慎,上线后不跟进,滥用公司宝贵的设计和开发资源。用数据驱动公司业务不断发展,而公司的运营状况也通过数据不断反馈给所有人,所有人努力的方向和绩效的评估都通过业务数据关联在一起,并能够有效量化。
事实上,公司到了一定规模,产品功能越来越复杂,人员越来越多,不管用什么驱动,最后一定都是数据驱动。没有量化的数据,不足以凝聚团队的目标,甚至无法降低团队间的内耗。这个时候哪个部门能有效利用数据,能用数据说话,能用数据打动老板,哪个部门就能成为公司的驱动核心,在公司拥有更多话语权。**我们学大数据,手里用的是技术,眼里要看到数据,要让数据为你所用。数据才是核心才是不可代替的,技术并不是。**
数据,不管你用还是不用,它就在那里。但是它的规律与价值,你不去分析、挖掘、思考,它不会自己跳出来告诉你答案。顶尖的高手,总是能从看似不相干的事物之间找到其联系与规律,并加以利用,产生出化腐朽为神奇的功效。我们应该对数据保持敏感与好奇,不断将现实发生的事情与数据关联起来,去思考、去分析,用数据推断出来的结论指导现实的工作,再根据现实的反馈修正自己的方法与思维,顶尖高手就是在这样的训练中不断修炼出来的。
现实纷繁复杂,其呈现出来的表象距其本质通常相去甚远,甚至南辕北辙。根据表象见招拆招,只会让你陷入现实纷乱的漩涡,疲惫且无效,就像热锅上的那只蚂蚁。数据作为对事物的一次抽象,能够强迫你去思考事物背后的规律与本质,并在思考过程中逐渐把握事物发展的脉络与走向,帮你抢占先机、掌控局面。“君子生非异也,善假于物也”,用好数据,方能洞悉真相。
1月3日我做客“极客Live”很高兴和同学们在直播中互动当时由于时间关系很多同学的问题来不及回答。正好今天在专栏的答疑里我再选几个有代表性的问题和你聊聊我的看法。
点击[链接](http://mp.weixin.qq.com/s/0o-mO6lcCGZ9IvjIzzZtCA)查看李智慧“学习大数据有哪些机遇”直播回顾。
>
没有大数据的开发经验,怎么去面试大数据的职位呢?
我认为越是好的公司,越是优秀的面试官,越是不在意你的经验,他们会更看重你的基础能力和解决问题的思路。所以你如果对自己的基础和素质有信心,你就多去面试,多接触机会,不要在经验上遮遮掩掩,不要怕面试失败,被那些不好的公司、差劲的面试官拒绝也许是一件好事。当然,你也应该只是缺乏经验,而不是对大数据一无所知,所以面试之前尽量对大数据技术原理和知识体系有完整的掌握,这也是我的专栏想达到的目的。
>
分布式系统相关的理论是每个互联网后端开发必备的吗?
是的,互联网技术架构就是分布式技术架构,互联网应用的主要技术挑战:大并发、大流量、高可用、高性能、可伸缩、可扩展,几乎都是用各种分布式技术解决的,如果不懂各种分布式技术及其理论,几乎不可能成为一名优秀的后端工程师。大数据技术实际上也是一种分布式技术,是分布式存储和分布式计算的一种。
>
请问老师,如何快速查看源码学习呢?
<li>
看论文和文档,了解主要架构原理和设计思路,想象如果是自己开发这个系统,该如何编程开发,设计模式和编程技巧其实就那些,学得多了、看得多了,有些代码不用看,猜也能猜得到会怎么写。
</li>
<li>
IDE环境debug源代码跟踪代码执行从调用主入口一路跟踪过去核心代码也就差不多看好了。有些系统会有各种超时比如debug会超时就在关键代码输出日志看关键输入输出是什么进一步看代码如何实现。
</li>
<li>
网上也有各种主要开源产品的源码分析,看看这些文章,有时候也能事半功倍。
</li>
这些前提都需要自己的编程基础扎实,各种设计模式编程技巧掌握得好,不然一堆接口、各种多态,看不了几行就晕头转向了。当然看优秀开源产品的源码本身也是非常好的学习过程,一边看一边学。
最后还是“老规矩”,我整理了@安静@桃园悠然在@老男孩@吴科的留言,希望同学们的留言对你也有所启发。
<img src="https://static001.geekbang.org/resource/image/17/e0/17b8331682b64f0be0932f445beb40e0.png" alt=""><img src="https://static001.geekbang.org/resource/image/d1/19/d194bca293f48e6c384ad1f7fe810919.png" alt=""><img src="https://static001.geekbang.org/resource/image/12/3b/12f21e2c0be4a81a240d79661f35063b.png" alt=""><img src="https://static001.geekbang.org/resource/image/6f/70/6f7673a5a396aa92852ee727f1762070.png" alt="">
欢迎你点击“请朋友读”,把今天的文章分享给好友。也欢迎你写下自己的思考或疑问,与我和其他同学一起讨论。