CategoryResourceRepost/极客时间专栏/数据分析实战45讲/第一模块:数据分析基础篇/07 | 用户画像:标签化就是数据的抽象能力.md
louzefeng d3828a7aee mod
2024-07-11 05:50:32 +00:00

159 lines
11 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

<audio id="audio" title="07 | 用户画像:标签化就是数据的抽象能力" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/ae/91/aee6e3c6f3c97f4e2506594c58713591.mp3"></audio>
王兴说过我们已经进入到互联网的下半场。在上半场也就是早期的互联网时代你永远不知道在对面坐的是什么样的人。那个年代大部分人还是QQ的早期用户。在下半场互联网公司已经不新鲜了大部分公司已经互联网化。他们已经在用网络进行产品宣传使用电商销售自己的商品。
这两年引领下半场发展的是那些在讲 “大数据”“赋能”的企业,他们有数据,有用户。
通过大数据告诉政府该如何智慧地管理交通,做城市规划。
通过消费数据分析,告诉企业该在什么时间生产什么产品,以最大化地满足用户的需求。
通过生活大数据告诉我们餐饮企业,甚至房地产企业该如何选址。
如果说互联网的上半场是粗狂运营,因为有流量红利不需要考虑细节。那么在下半场,**精细化运营将是长久的主题**。有数据,有数据分析能力才能让用户得到更好的体验。
所以,用户是根本,也是数据分析的出发点。
假如你进入到一家卖羊肉串的餐饮公司,老板说现在竞争越来越激烈,要想做得好就要明白顾客喜欢什么。于是上班第一天,老板问你:“你能不能分析下用户数据,给咱们公司的业务做个赋能啊?”
听到这,你会怎么想?
你说:“老板啊,咱们是卖羊肉串的,做数据挖掘没用啊。”估计老板听后,晚上就把你给开了。
那该怎么办呢?如果你感觉一头懵,没关系,我们今天就来讲讲怎么一步步分析用户数据。
## 用户画像的准则
首先就是将自己企业的用户画像做个白描,告诉他这些用户“都是谁”“从哪来”“要去哪”。
你可以这么和老板说“老板啊用户画像建模是个系统的工程我们要解决三个问题。第一呢就是用户从哪里来这里我们需要统一标识用户ID方便我们对用户后续行为进行跟踪。我们要了解这些羊肉串的用户从哪里来他们是为了聚餐还是自己吃宵夜这些场景我们都要做统计分析。第二呢这些用户是谁我们需要对这些用户进行标签化方便我们对用户行为进行理解。第三呢就是用户要到哪里去我们要将这些用户画像与我们的业务相关联提升我们的转化率或者降低我们的流失率。”
听到这,老板给你竖起了大拇指,说:“不错,都需要什么资源,随时找我就行。”
<img src="https://static001.geekbang.org/resource/image/0f/f4/0ff019f3f87f627dd5522411f67a45f4.jpg" alt=""><br>
刚才说的这三个步骤,下面我一一给你做个梳理。
**首先,为什么要设计唯一标识?**
**用户唯一标识是整个用户画像的核心**。我们以一个App为例它把“从用户开始使用APP到下单到售后整个所有的用户行为”进行串联这样就可以更好地去跟踪和分析一个用户的特征。
设计唯一标识可以从这些项中选择用户名、注册手机号、联系人手机号、邮箱、设备号、CookieID等。
**其次,给用户打标签。**
你可能会想,标签有很多,且不同的产品,标签的选择范围也不同,这么多的标签,怎样划分才能既方便记忆,又能保证用户画像的全面性呢?
这里我总结了八个字,叫“**用户消费行为分析**”。我们可以从这4个维度来进行标签划分。
<li>
用户标签:它包括了性别、年龄、地域、收入、学历、职业等。这些包括了用户的基础属性。
</li>
<li>
消费标签:消费习惯、购买意向、是否对促销敏感。这些统计分析用户的消费习惯。
</li>
<li>
行为标签时间段、频次、时长、访问路径。这些是通过分析用户行为来得到他们使用App的习惯。
</li>
<li>
内容分析:对用户平时浏览的内容,尤其是停留时间长、浏览次数多的内容进行分析,分析出用户对哪些内容感兴趣,比如,金融、娱乐、教育、体育、时尚、科技等。
</li>
可以说,用户画像是现实世界中的**用户的数学建模**,我们正是将海量数据进行**标签化**,来得到精准的用户画像,从而为企业更精准地解决问题。
最后,当你有了用户画像,可以为企业带来什么业务价值呢?
我们可以从用户生命周期的三个阶段来划分业务价值,包括:**获客、粘客和留客**。
<li>
获客:如何进行拉新,通过更精准的营销获取客户。
</li>
<li>
粘客:个性化推荐,搜索排序,场景运营等。
</li>
<li>
留客:流失率预测,分析关键节点降低流失率。
</li>
如果按照数据流处理的阶段来划分用户画像建模的过程,可以分为数据层、算法层和业务层。你会发现在不同的层,都需要打上不同的标签。
**数据层**指的是用户消费行为里的标签。我们可以打上“事实标签”,作为数据客观的记录。
**算法层**指的是透过这些行为算出的用户建模。我们可以打上“模型标签”,作为用户画像的分类标识。
**业务层**指的是获客、粘客、留客的手段。我们可以打上“预测标签”,作为业务关联的结果。
所以这个标签化的流程,就是通过数据层的“事实标签”,在算法层进行计算,打上“模型标签”的分类结果,最后指导业务层,得出“预测标签”。
<img src="https://static001.geekbang.org/resource/image/f0/2f/f0e94ab9319dc561df3cdd781526c22f.jpg" alt="">
## 美团外卖的用户画像该如何设计?
刚才讲的是用户画像的三个阶段,以及每个阶段的准则。下面,我们来使用这些准则做个练习。
如果你是美团外卖的数据分析师你该如何制定用户标识ID制定用户画像以及基于用户画像可以做哪些业务关联
首先我们先回顾下美团外卖的产品背景。美团已经和大众点评进行了合并因此在大众点评和美团外卖上都可以进行外卖下单。另外美团外卖针对的是高频O2O的场景美团外卖是美团的核心产品基本上有一半的市值都是由外卖撑起来的。
基于用户画像实施的三个阶段,我们首先需要统一用户的唯一标识,那么究竟哪个字段可以作为用户标识呢?
我们先看下美团和大众点评都是通过哪些方式登录的。
我们看到美团采用的是手机号、微信、微博、美团账号的登录方式。大众点评采用的是手机号、微信、QQ、微博的登录方式。这里面两个APP共同的登录方式都是手机号、微信和微博。
那么究竟哪个可以作为用户的唯一标识呢?当然主要是以用户的注册手机号为标准。这样美团和大众点评的账号体系就可以相通。
当然,大家知道在集团内部,各部门之间的协作,尤其是用户数据打通是非常困难的,所以这里建议,如果希望大数据对各个部门都能赋能,一定要在集团的战略高度上,尽早就在最开始的顶层架构上,将用户标识进行统一,这样在后续过程中才能实现用户数据的打通。
然后我们思考下,有了用户,用户画像都可以统计到哪些标签。我们按照“**用户消费行为分析**”的准则来进行设计。
<li>
用户标签:性别、年龄、家乡、居住地、收货地址、婚姻、宝宝信息、通过何种渠道进行的注册。
</li>
<li>
消费标签:餐饮口味、消费均价、团购等级、预定使用等级、排队使用等级、外卖等级。
</li>
<li>
行为标签:点外卖时间段、使用频次、平均点餐用时、访问路径。
</li>
<li>
内容分析:基于用户平时浏览的内容进行统计,包括餐饮口味、优惠敏感度等。
</li>
**当你有了“用户消费行为分析”的标签之后,你就可以更好地理解业务了。**
比如一个经常买沙拉的人,一般很少吃夜宵。同样,一个经常吃夜宵的人,吃小龙虾的概率可能远高于其他人。这些结果都是通过数据挖掘中的关联分析得出的。
有了这些数据,我们就可以预测用户的行为。
比如一个用户购买了“月子餐”后,更有可能购买婴儿水,同样婴儿相关的产品比如婴儿湿巾等的购买概率也会增大。
具体在业务层上,我们都可以基于标签产生哪些业务价值呢?
<li>
**在获客上**,我们可以找到优势的宣传渠道,如何通过个性化的宣传手段,吸引有潜在需求的用户,并刺激其转化。
</li>
<li>
**在粘客上**,如何提升用户的单价和消费频次,方法可以包括购买后的个性化推荐、针对优质用户进行优质高价商品的推荐、以及重复购买,比如通过红包、优惠等方式激励对优惠敏感的人群,提升购买频次。
</li>
<li>
**在留客上**预测用户是否可能会从平台上流失。在营销领域关于用户留存有一个观点——如果将顾客流失率降低5%公司利润将提升25%~85%。可以看出留存率是多么的重要。用户流失可能会包括多种情况,比如用户体验、竞争对手、需求变化等,通过预测用户的流失率可以大幅降低用户留存的运营成本。
</li>
## 锻炼自己的抽象能力,将繁杂的事务简单化
上面我们讲到的“用户消费行为标签”都是基于一般情况考虑的,除此之外,用户的行为也会随着营销的节奏产生异常值,比如双十一的时候,如果商家都在促销就会产生突发的大量订单。因此在做用户画像的时候,还要考虑到异常值的处理。
总之数据量是庞大的会存在各种各样的使用情况。光是分析EB级别的大数据我们就要花很长的时间。
但**我们的最终目的不是处理这些数据,而是理解、使用这些数据挖掘的结果**。对数据的标签化能让我们快速理解一个用户,一个商品,乃至一个视频内容的特征,从而方便我们去理解和使用数据。
对数据的标签化其实考验的是我们的抽象能力,在日常工作中,我们也要锻炼自己的抽象能力,它可以让我们很快地将一个繁杂的事物简单化,不仅方便理解,还有益后续的使用。
我们今天讲了用户画像的流程,其中很重要的一个步骤就是给用户打标签,那么你不妨想想,如果给羊肉串连锁店进行用户画像分析,都可以从哪些角度进行标签化?
最后,我们从现实生活中出发,打开你的手机,翻翻看你的微信通讯录,分析下你的朋友圈,都有哪些用户画像?如果你来给它设计标签,都有哪些种类需要统计呢。为了方便后续使用,你是如何将他们归类分组的?
欢迎在评论区与我分享你的答案,我会和你一起探讨。也欢迎点击“请朋友读”,把这篇文章分享给你的朋友或者同事,我们一起交流,一起进步。