This commit is contained in:
louzefeng
2024-07-11 05:50:32 +00:00
parent bf99793fd0
commit d3828a7aee
6071 changed files with 0 additions and 0 deletions

View File

@@ -0,0 +1,126 @@
<audio id="audio" title="30 | AI产品经理你该如何提升自己的价值" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/a5/2a/a5a772039e7d5ed32e7e49ae0ee3a02a.mp3"></audio>
你好,我是海丰。
在平时工作中,产品经理的工作价值其实很难被衡量。因为产品经理既不像技术人员,有算法模型以及工程系统的开发成果,也不像运营人员,有可衡量的运营效果和直接的经济收益。我们能看到的产品经理的产出,只有设计原型和一堆 PRD 文档。这就导致很多时候,产品经理的价值感太低,只是业务部门和研发部门的传话筒,周而复始地“接需求”,把需求转化成 PRD 和原型,再输出给技术部门。
那么产品经理怎么才能更好地证明自己的价值呢这节课我们就来说说AI产品经理的三大能力价值以及具体的提升方法。
## 数据能力价值
数据是人工智能产品的基础所以AI产品经理首先要具备的就是数据能力价值。换句话说就是AI产品经理要懂得利用数据去构建产品这包括通过数据分析出业务的含义以及根据数据制定出业务发展中的关键指标等等。简单来说就是要知道怎么分析数据、理解数据和处理数据。
接下来,我就通过一个例子来详细说说怎么分析数据。
假设你们公司是一家电商平台入驻的商家可以在平台上卖货平台会按照佣金比例进行分成。下图就是你们公司和商家分成的波士顿距阵图BCG Matrix波士顿咨询集团规划产品的一种方法旨在体现企业产品品种以及结构适合市场需求的变化其中横轴代表商家在平台上的销售量纵轴代表商家在平台上的平均客单价圆圈大小代表商家给平台带来的利润高低。
<img src="https://static001.geekbang.org/resource/image/9c/e0/9cfd3b76833d4cd101112227995987e0.jpg" alt="">
如果我只给你10秒的时间你能从这张图中分析出来哪些信息呢
**拿到一张图,我们先看它的结构。**从右侧的图中,我们可以看到,销售量在 6000 以上的商家只有三家,其余的都是销售量不到 1000 的小商家。如果我们把商家按照头部(销售量 &gt;= 6000、中部6000 &gt; 销售量 &gt;= 3000和尾部销售量 &lt; 3000 )进行划分的话,平台的中部商家数量就是零,也就是说平台的中部商家是断层的。显然,这样的商家结构是非常不合理的,不利于平台今后的供应链发展,因为它太过依赖于头部的 TOP 商家了。
**接着,我们来看它的盈利。**作为一个健康的业务来说,不能单纯地看 GMV我们也要看业务的盈利能力。从图中我们可以看出头部高销量的商家给平台带来的利润极低因为它的代表利润的圆圈很小因为平台对于这些商家来说并没有议价能力。
通过分析图中的数据,我们可以总结出平台今后的发展策略:**巩固头部商家,同时重点扶持中小型商家**。与此同时,平台业务发展的关键考核指标,就应该是平台商家向上的跃迁率,以及商家结构的合理性。
知道了什么是数据分析,接下来,咱们再说说什么是理解和处理数据。
**理解数据就是理解数据的属性,数据属性是指数据本身的特征,它包括数据类型、数据质量等不同维度的属性。**其中,数据类型有图像数据、文本数据和声音数据,不同的数据类型在工人智能技术中有不同的分析方法和建模方法。比如图像数据一般采用卷积神经网络模型进行处理,文本数据一般通过 NLP 技术处理。
**数据质量指的是数据的结构化程度、分布情况、异常情况等**,不同质量的数据对于 AI 产品的影响还是很大的。
**处理数据就是要懂得机器学习模型构建过程中的数据处理流程**,产品经理虽然在实际工作中并不参与数据处理,但我更建议你在项目的初期参与数据的评估,因为这项能力对于产品经理来说在目前市场环境下有着非常大的竞争力。
说了这么多,我们到底该怎么提升数据能力价值呢?
提升数据能力价值,我们主要从理解数据和分析数据入手。理解数据需要我们了解,不同 AI 场景下需要什么样的数据准备,这需要你在实践中进行体会。分析数据则需要你掌握一些统计学和数据分析相关的知识,以及一些数据分析工具(如 Python、Tableau甚至是一些经济学和心理学。
方向找到了,具体的实施途径就非常多了。我比较推荐的是,你去阅读几本相关的书籍,先系统掌握这些知识的结构,再逐一精进各个核心知识点。这里,我推荐以下几本书。
- 《女士品茶——统计学如何变革了科学与生活》:了解统计学必看的入门级图书
- 《独立思考:日常生活中的批判性思维》:批判性思维课程的教科书,从逻辑学、科学方法论等角度介绍正确的思维方法
- 《京东平台数据化运营》:京东平台的实操案例,介绍了如 App、微信手 Q 等无线流量端,关于优化搜索流量以及提升转化率指标的实践方法
- 《机器学习》:是人工智能领域的入门教材,数据分析师可以学到一些必备的算法知识
## 算法能力价值
接着,我们再来说说产品经理和开发人员的配合过程,看看这个过程中,我们该怎么体现自己的价值。
一般来说,产品经理的工作就是以提需求为主,交付给研发人员 PRD 文档也就是产品经理制定的目标然后研发工程师实现这些目标。我们发现AI产品经理很少参与研发的实现过程。
因此,**想在这个过程中提升自己的价值,我认为 AI 产品经理必须要懂算法,至少是浅层机器学习算法**,这样才能给算法工程师提出更准确的需求,以及在建模的过程中做好配合工作。具体该怎么做呢?
假设业务方提出要制作一个用户复购模型作为AI产品经理我们可以按照如下的顺序进行思考
- 确定这个需求的问题分类,比如是分类问题还是回归问题
- 明确解决这类问题有哪些合适的算法
- 在同行业进行对比,确定这个需求问题能实现到什么程度
这其实是一个通用的问题模板,具体的问题你可以不断迭代和细化。那么,搞清楚这些问题后,我们就可以接着和开发人员深入沟通具体的需求。总的来说,**良好沟通的前提是你要理解算法**。
另外,这么做也能让我们在模型构建出现问题,需要延期或者其他资源支持的时候,利用非技术的语言和公司领导以及客户进行沟通,这更容易获得他们的支持和认可。
## 包装能力价值
很多人在职场都吃了不会包装自己的亏,比如我下面要说的这两个故事。
第一个故事。我在公司里听研发同学晋升述职的时候,提报部门的同事经常会跟我说,这个研发小哥哥的技术能力很牛的,对部门做了不少贡献,价值观也很正,就是表达能力差一些,不太会说出自己的价值,所以职级的评定可能会受些影响。
第二个故事。几年前,新东方年会上一个魔性视频讽刺了一种现象:公司内很多脚踏实地的人往往会输给拿着 PPT 忽悠管理者的“投机者”。从此之后,“在公司里,做事儿的赶不上写 PPT 的”这句话就火了起来。
我们身边其实还有很多这样的小故事,不会包装吃到的“亏”我相信你也深有体会。我知道,有一部分人对自我能力的包装是有偏见的。事实上,**随着市场变化、认知升级,包装能力已经成为了每一个职场人都要掌握的能力,它对产品经理来说更是基本素质**。
如果我问你怎么对产品包装,你一下子就能想到,可以用大量的文案和营销手段进行宣传。那么对于个人来说,我们应该怎么包装自己,在公司中树立起个人的品牌呢?
美国认知心理学家诺曼提出的情感化设计理论,将情感体验设计分为三个层次:本能层、行为层、反思层。这个理论运用到个人品牌的包装上同样适用。
<img src="https://static001.geekbang.org/resource/image/c2/42/c2de661ca58385cd0ec7da1166b37342.jpg" alt="">
**首先,本能层指的就是外表**,比如,很多人就是冲着苹果或者无印良品的极简主义设计才去购买的产品。我们给人的第一印象就是自己的外表和履历,外表就是外貌和衣品,履历就是毕业院校和过往经历。
我们一定不要回避这个问题,在“颜值即是正义”的时代,让别人了解自己,一定是从给别人留下一个良好的个人形象开始的。
**其次是行为层,它指的是你在工作中的习惯或者说你个人的标签**,比如“靠谱”、“积极”、“专业”、“沟通力强”……事实上,我们身边总是有同事很容易受到领导和其他同事的喜爱,其实就是行为层在起作用。
当别人从形象开始了解我们之后,紧接着我们就要从行为给自己打上一个“标签”,然后不断地向对的人展示对的标签,这样别人才会认为你是有着这样“标签”的人。然后,当公司领导或者同事、朋友有了合适的机会的时候,第一个想到的就是你。
机会只会留给那些能接得住的人,如果说本能层和行为层是创造机会的过程,**反思层就是能让你和其他人拉开差距的一层**。这么说感觉有点抽象,我来举个例子。
我平时在工作的时候经常会和很多研发同学打交道,比如作为面试官、作为晋升评审委员、作为需求提出方、作为需求承接方等等。一般在沟通的时候,我就能发现我对面这个人的职业天花板在哪里,比如说他在公司会是一个什么样的定位,不出意外的话,他未来的职业生涯能够到多高的位置,这其实都体现在相互沟通的层次上。
比如说,我经常会问面试者一个问题:“你觉得初中级产品经理和高级产品经理的区别是什么?”这个问题,你也可以想一想。
那如果我们从这三层来思考的话,答案分别是什么呢?
如果从本能层来思考,就是当你达到公司的硬件门槛,懂业务、会沟通、善表达,并且有一定的产品设计想法的时候,你会觉得,初中级产品经理和高级产品经理的区别在于,专业能力深耕的程度不同。
如果从行为层来思考,也就是在本能层的基础上,你善于思考和总结,并且会适当地包装自己,不断地输出和迭代自己的知识和经验。这个时候,你可能会觉得初中级产品经理和高级产品经理的区别在于,对业务规划、产品定位,以及用户把控上的不同。
如果从反思层来思考,也就是当你可以捕捉思维认知上的差异的时候,你可能会觉得初中级产品经理和高级产品经理的区别在于,你所能驾驭、影响的领域或者用户的范围不同。
虽然说,每个人的地位和价值都有着天壤之别,不是一朝一夕能追得上的,但是你的思维、认知和眼界会悄悄影响这一切。说了这么多,其实我想说的就是一句话:**埋头做事的时候,别忘了抬头讲故事,我们要学会主动把个人“品牌价值”推送到别人面前**。
## 小结
这节课,我们学习了 AI 产品经理的三大必备能力价值,分别是**数据能力价值、算法能力价值,以及包装能力价值**。
首先,数据能力价值包括理解数据和分析数据。理解数据就是掌握基于数据构建产品的过程,比如,什么场景需要什么数据进行构建,分析数据就是掌握通过数据分析制定业务发展关键指标的能力。
其次,算法能力价值就是通过对浅层机器学习算法的理解,准确地给算法工程师提出需求,能够做到同频沟通,以及在建模的过程中,通过非技术性表达给领导和客户进行汇报。
最后,包装能力价值具体来说就是:可以定位自己,给自己打标签,可以准确表达自己的产出和价值,以及对业务规划和行业发展有一定深度的思考。
除此之外,我还有些职场心得要送给你,总结起来就是**善于思考、执行迅速、事事有回应、件件有着落,且超出预期,以及重视稀缺性**。作为一个职场产品经理人,这都是你可以提升的关键点。
如果你只是刚刚踏上产品经理这个岗位的新人,我还有几条额外的建议想要送给你。
要有计划、有积累,在寻求公司价值的同时,要对自己个人未来的价值有追求和计划。
学习一些时间管理四象限,一定要重视重要不紧急的事情,新人不要觉得时间多就随意挥霍,你的价值才能决定你的圈子和你的人脉。
要自己定位自己,不要让别人或你的上级定位你,虽然屁股决定脑袋,但你对自己的定位会决定你屁股的位置。
要善于归纳总结和思考,这慢慢会让你和其他人拉开差距。
对于如何提升自我价值这个话题,你还有什么想聊的吗?期待在留言区看到你的故事,我们下节课见!

View File

@@ -0,0 +1,217 @@
<audio id="audio" title="31 | AI产品经理面试这些问题你必须会答" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/de/f2/de2bd1df1e0147d6bb50450915d0dff2.mp3"></audio>
你好,我是海丰。
我们在看大厂或者独角兽企业招聘信息的时候,会发现他们最看重两方面:学历和经历。学历一般是看你的学校是不是名校,专业是不是对口。经历一般是看你是否在行业内的知名公司待过,有没有优秀的项目产出。这是我们进入知名互联网公司最基础的敲门砖。
那么这是不是就意味着普通院校出身、没有互联网大项目经验的同学就没有机会了呢其实也不全是这要靠一点点的“运气”比如一些独角兽企业一直没有招到合适的人业务老大急需要干活的人而你又恰好在面试的时候表现很好就很可能顺利拿到Offer。
不过,这种“运气”并不常有。因为产品经理入门的门槛比较低,所以很多企业会把招聘的门槛设在学历和经历这些硬性指标上。
看到这儿你是不是有些气馁难道我之前付出的努力全都白费了吗当然不是。相比于传统产品经理AI产品经理的处境可好太多了。 AI 产品经理有天然的稀缺性,还有专业技术加持,现阶段企业对 AI 产品经理的要求放得比较宽,毕竟目前这方面的人才还是太少了。
因此如果你想抓住AI产品经理岗位现阶段的红利顺利拿到Offer、进入大厂除了要学好我们的专栏夯实AI技术能力面试环节也是必须要重视的。这节课我就带你梳理一下AI产品经理面试的常见问题和应对策略。
面试官在考察候选人之前,事先都会对岗位进行定义,再决定问你哪些问题。虽然产品经理日常大多数情况下都在画原型、写文档,但面试官并不会考察这些,毕竟意义不大。
那么,在 AI 产品经理的面试过程中,面试官会从哪些角度,来观察考察候选人的哪些基本素质呢?接下来,请你把自己代入面试者的角色,和我一起来参加这场面试实战吧!
## 过往经历介绍
首先,欢迎你参加这次面试,请先做个自我介绍吧!说说你在上一家公司主要负责什么,你做过的最有价值的一件事是什么?
这几乎是所有面试的开场白,你一般都是怎么回答的呢?我发现经常会有面试者这么回答:“我做了大量调研工作,写了调研报告,然后画了原型图,最后产出了 PRD文档经过评审敲定了最终的方案然后是研发开发产品上线之后效果还不错。”
类似这样的回答其实没有提供给我有效的信息,因为这样的工作流程不仅和其他人的一样,还没有具体的细节,体现不出来候选人的产品思维和设计能力,甚至还会让面试官感觉你的项目经历是造假的。
那我们该注意些什么呢?**在介绍工作内容的时候,你要注意有逻辑、有数据、有价值。**也就是说你要注意每件事情发生的前因后果,它们之间的逻辑关联,同时追求真实性,不造假。**更重要的是,要更多地展示出自己对工作的认知,在讲流程化工作内容的基础上,提供一些有价值的内容**,比如相关项目的数据表现等等。
下面是我给出的一个示例,你可以参考一下。
我在上一家公司主要负责的是旅游品类产品的设计,做了两个重点的项目,分别是用户留存模型和智慧营销模型。
在用户留存模型的项目中,我先基于现有留存数据和用户行为数据进行定量分析,又基于用户调研和访谈进行定性分析。然后,我对用户流失原因进行了判断,提出可能造成流失的原因,并提出了提升留存的备选方案。接着,我就和算法同学沟通各种方案的落地成本,最后进行了实验,确定各个方案的优先级,最终推进了用户留存模型产品的建设,它的数据表现是这样的……
## 产品行业认知
接下来,请说说你们产品的主要竞品是谁?你认为的行业现状什么样?你对行业未来发展趋势的理解,以及你最喜欢的一款 AI 产品是什么?
这是面试官在考察一个 AI 产品经理除了作为产品功能设计者之外,对所负责产品行业的认知,是否具备一定的行业视野。一个卓越的产品经理一定是能快速讲清楚**自己产品在行业中的份额、竞争力和不足,以及市场现状布局和未来走势**等等。
想要回答好这些问题你可以参考专栏第一篇章“知己知彼AI和AI产品经理”里面的内容别忘了一定要结合自己的行业现状。
## 产品案例问题
接下来,就到了这次面试的第一个小高潮,你做过什么产品案例呢?如果我们最近遇到一个这样的问题,业务方希望我们通过 AI 预测有买花需求的用户,然后给他们发 push你有什么好的想法吗
这类产品案例问题一般都是招聘部门真实遇到过的问题,面试官并不会真的预期你能在几分钟给出一个完美的答案,他只是在考察你**分析、拆解问题的能力,以及结构化思维逻辑的能力**。
针对上面的问题,你会给出什么答案呢?如果是我作为面试官,我希望面试者能从项目建设的视角出发,思考和拆解各环节的工作,然后给出每个环节的工作内容、交付物,也就是如下的步骤:
- 产品定义,做这件事情的背景、价值、以及预期目标都是什么;
- 技术预研,判断目前积累的数据和沉淀的算法,是否可以达到我们的业务需求;
- 准备数据,根据模型预研的结果以及公司的实际情况,来帮助算法同学准备数据;
- 模型构建,产品经理协助算法工程师进行模型的构建,并对最终交付的模型进行验收;
- 工程建设,产品经理协调研发团队、算法团队,以及其他第三方的资源依赖,推进需求的产品化落地工作;
- 效果评估,上线后持续对效果进行监控、迭代模型。
基本上,这样的回答就可以让面试官满意了。但如果你是一名高级产品经理,我还建议你可以从业务经验出发,给出一些具有启发性的答案,这会是你的加分项。
## AI 技术问题
最后,面试官会考察你一些 AI 技术问题,这和传统互联网公司的产品经理面试有很大的不同。
目前,人工智能领域的岗位细分还没有成熟,很多企业并不会设立 AI 产品这样的部门,面试官很多都是纯算法或数据出身的人,所以在考察你岗位能力的时候,很自然地就会考察你对技术掌握的深度和广度。
因此你在准备AI产品经理面试的时候也要对技术问题有所准备具体来说就是你要能回答上来算法工程师或者数据挖掘工程师的初级技术面试题。
面试官经常会问的技术问题有两类,分别是**基础技术问题和算法问题**。基础技术问题可能会问什么是特征清晰、数据变换、训练集、验证集、测试集什么是过拟合、欠拟合、跨时间测试和回溯测试机器学习的三大类应用场景是什么算法类问题可能会问逻辑回归和线性回归的区别是什么什么是KNN、聚类分析、决策树模型等等。
## 小结
如果你已经准备参加AI产品经理的面试了那么我希望你能从 6 方面做好面试的准备分别是行业知识、项目流程、基础技术、模型评估、经典算法以及场景案例。我一共准备了20道典型的问题把它们按照分类总结在了一张思维导图里你可以利用它先来检测一下你各方面知识的掌握程度。
<img src="https://static001.geekbang.org/resource/image/3c/9b/3c540cyy3b2a94386c3af7db3f3d429b.jpg" alt="">
为了方便你进行验证,我把这些问题的考点、思路和参考答案都梳理在了下面,希望你能好好利用起来。
问题1你怎么看待 AI 或者人工智能行业?
考点:考察你对当前人工智能行业发展情况的了解,是否具有预判未来发展趋势和潜在机会的能力。
思路:首先,你需要从全局的角度分析你对 AI 行业现状的理解;其次,最好举一两个当前 AI 的新技术或者新应用来表达你在实时关注这个行业;最后,一定要给出你对这个行业独特的看法。
回答我认为当前人工智能行业正在逐步从实验室走向工业界。从产业链条上看AI 主要分为三层,最底层是芯片、云服务等组成的基础支撑层。中间是提供底层 AI 技术的技术层,比如商汤、依图等提供的图像识别技术。上层是应用层,也就是我们最常见的电商搜索推荐,教育行业的 AI 课程。
从应用场景上看,金融、安防、客服是我们目前应用十分广泛的领域。同时,其他行业也在逐步引入 AI 技术。比如好大夫在线,最近就分享了他们如何通过 AI 技术,来进行医学报告单结构化的工作。
在我看来AI 现在的应用还远远不够,可能 3 年或 5 年之后AI 必将成为一种基础设施,应用在各行各业,这就有点类似我们 10 年前讨论的移动互联网技术,现在绝大多数行业都离不开移动互联网,移动互联网技术已经成为了行业的基础建设了,那么 AI 大概率也会走上类似的道路。
问题2对于业务场景通过 AI 技术可以做哪些工作来提升用户体验?
考点:考察你对于业务场景的理解程度以及 AI 技术边界的了解。
思路首先你需要问清楚对方的业务场景是什么他的用户是谁用户需要通过这个产品解决的问题是什么然后再考虑目前的AI技术是不是可以有提升点。如果你对对方提供的业务场景不了解也可以说你们公司或者你了解的某些业务场景毕竟面试官不是为了套你的方案而是为了考察你对于 AI 技术边界的了解,和你是不是具有发现需求的能力。
回答:我对您这边的业务还不太了解,不过我之前在一家线上旅游公司工作,我们的模式是直接根据用户搜索结果展示旅游产品列表。但其实我们可以根据每个商品的好评率,对其进行解析,形成一个简单的一句话评论展示在产品列表中,帮助用户进行选择,提高用户点击率。
问题3现在市场上有哪些竞品公司有什么优缺点
考点:同问题 1考察你人工智能行业发展现状的了解以及基于你所处业务的同类 AI 竞品公司的分析能力。
思路:首先,你需要从全局的角度分析你对 AI 行业现状的理解;其次,针对你所处的行业来表达你们的产品技术和竞品的产品的定位、受众,以及优劣势等;最后,一定要给出你对所处行业独特的看法。
问题4你们的模型构建流程是怎么样的
考点:考察你对 AI 项目构建过程的熟悉程度,类似于传统产品经理建设研发项目的过程。
思路:先回答 AI 项目从筹备到上线的全过程,比如分几个阶段,每一个阶段都有什么角色参与,每个角色需要做什么工作,他们的产出又都是什么。然后再回答 AI 产品经理的完整工作流程是什么,需要参与哪些阶段和具体的工作。
回答:具体的回答,你可以参考第 05 讲。
问题5AI 产品经理和传统产品经理的区别是什么?
考点:考察候选人除了对通用的产品能力理解之外,是否熟悉 AI 行业、产业结构,是否了解实现目标的技术手段、算法等等。
回答:具体的回答你可以参考第 02 讲。
问题6什么是特征清洗、数据变换
回答:数据清洗就是对数据进行清洗,去掉重复值、干扰数据,以及填充缺失值。
数据变换就是将数据处理成方便模型使用的数据形式。比如我们需要使用用户的身高作为模型特征,但是有的数据是用厘米作单位,有的数据会使用米作单位。这个时候,我们就需要使用归一化,把数据的单位统一成米或者厘米。归一化也是数据变换最主要的手段。
问题7什么是训练集、验证集和测试集<br>
回答:训练集是让机器学习的样本集合,用来拟合模型。验证集是模型训练过程中,用来对模型性能做初步的评估,用于模型参数调优。测试集是最终用来评估模型效果的。
问题8什么是过拟合和欠拟合
欠拟合就是偏差较大,指的是模型的预测结果和实际结果的偏差比较大,说白了就是模型预测不准。造成欠拟合的原因可能是特征少或者模型训练不足。过拟合就是方差偏大,指的是模型在一部分数据上表现好,在另一部分数据上表现差。造成过拟合的原因可能是特征过多而训练集不够。
问题9什么是跨时间测试和回溯测试
回答:跨时间测试也叫 OOT 测试,是测量模型在时间上的稳定性。回溯测试是用过去一段时间的真实数据构造出一个模拟的环境(回溯环境),让模型在历史的那段环境中运行,得到历史某个时间点的模型结果。
一般来说,跨时间测试是在模型上线之前就应该要做的事情。回溯测试是指模型已经存在并已经上线了,想要看模型在历史某个时间点的数据表现时候,进行的测试。
问题10机器学习的三大类应用场景都是什么
回答:三大类应用场景分别是分类问题、回归问题、聚类问题。
分类问题又可以分解成二分类问题和多分类问题。二分类问题的预测结果只有两个离散的值,如“是/否”"1/0"。多分类问题的预测结果是多个离散的值如“A、B、 C”。
回归问题的预测的结果是连续的值,如房价的预测、库存的预测。聚类问题是无监督学习,将相似的样本归类在一起,如细分客户、新闻聚类。
问题11你怎么评估模型的好坏
考点:考察你模型评估指标的掌握程度,回答时要说明模型评估的三个部分:统计性、模型性能和模型稳定性。
回答:模型评估的好坏可以通过模型评估指标进行衡量,模型评估指标包括三部分,分别是统计性指标、模型性能指标和模型稳定性指标。
统计性指标指的就是模型输出结果的覆盖度、最大值、最小值、人群分布等指标。
模型的性能评价指标主要包括混淆矩阵、KS、AUC 等等。通过混淆矩阵我们就可以得到一个模型的精确率、召回率这些指标从而可以评估一个模型的区分能力也可以计算得到TPR、FPR从而计算出AUC、KS等相关指标。
回归模型的性能评价指标主要包括MAE平均绝对误差、MSE均方误差、RMSE均方根误差、R 方等。
模型的稳定性即判断模型输出结果是否会随着时间推移而发生较大变化不再稳定的指标主要使用PSI进行评估。
问题12什么是 ROC 曲线?
回答ROC 曲线是分类算法模型的一种评价标准ROC 曲线的横坐标为假阳性率 FPR、纵坐标为真阳性率 TPR计算公式为 FPR = FP / NTRP = TP / P其中 P 是真实的正样本数量, N 是真实的负样本数量TP 是 P 个正样本中被分类器预测为正样本的个数FP 是 N 个负样本中被分类器预测为负样本的个数。
以一个医院诊断病人为例,假设有 10 位疑似感染患者,其中 3 位很不幸诊断阳性P = 3另外 7 位诊断阴性N = 7对于诊断阳性的 3 位患者,其中有 2 位确实是真正的患者TP = 2。那么真阳性率 TPR = TP / P = 2/3对于 7 位诊断阴性的患病者来说也很不幸误诊了一位患者FP = 1那么假阴性率 FPR = FP / N = 1/7。
对于分类器来说,这组分类结果就对应 ROC 曲线上的一个点 (1/7, 2/3),最后,由分类器计算出来的多个点组成 ROC 曲线。
问题13什么是 AUC
回答AUC 指的是 ROC 曲线下的面积大小,它能够量化地反映出基于 ROC 曲线的模型性能AUC 的取值一般在 0.5 ~ 1 之间AUC 越大,说明分类器性能越好。
问题14逻辑回归相比于线性回归有什么区别
考点:考察候选人对于线性回归和逻辑回归的理解。
回答:首先,它们最主要的区别是:逻辑回归解决的是分类问题,预测属于某类的概率;线性回归解决的是回归问题,预测一个连续变量(如降水量,价格等)。
线性回归使用的是最小化平方误差损失函数,对偏离真实值越远的数据惩罚越严重,容易受到异常值影响。逻辑回归是一种减小预测范围的函数,它将预测值限定为[0,1]间,不容易受到异常值的影响。
问题15你能介绍一下 KNN 的原理吗?
回答KNN 核心原理可以理解为“近朱者赤近墨者黑”,即基于距离的一个简单分类算法。在数据量不多,并且特征都相对单一的业务场景下,很适合选择 KNN 算法(详细内容见 09 讲)。
问题16你能介绍一下聚类分析吗
回答:聚类分析属于无监督算法,是按照个体的特征将数据分类,让同一个类别内的个体之间具有较高的相似度,不同类别之间具有较大的差异性。
K-means 算法是机器学习领域中处理无监督学习最流行、经典的聚类分析方法之一。它是典型的基于距离的聚类算法,采用距离作为相似性的评价指标,待测样本点距离聚类中心的距离越近,它的相似度就越大(详细内容见第 15 讲) 。
问题17你能介绍一下决策树模型吗
回答:随机森林的原理可以理解为“三个臭皮匠赛过诸葛亮”,特点是具有树形结构,可解释性强,直观好理解,而且还可以从结果向上去追溯原因。采用决策树可以更方便地向老板、业务方,或者甲方去解释模型是什么。
比如在金融风控场景下,我们经常通过决策树判断用户的违约风险。决策树在预测用户违约案例上的核心思想是,先获取部分用户的历史数据,历史数据包括过去的信贷数据和还款结果,然后将贷款客户不断进行分类,直到某个节点的样本用户都是同一个类型为止。最后,再对决策树进行剪枝,简化树的复杂度(详细内容见 13 讲)。
问题18请举例说明如何设计一个推荐类的产品。
考点:考察候选人对推荐类产品的召回、排序、调整各阶段的理解。在回答推荐类产品设计问题时,要明确每个阶段的基本策略和工作内容,最好还要了解相关经典算法或模型,比如召回阶段的协同过滤,以及排序阶段的 CTR 预估(详细内容见第 23 讲)。
问题19请举例说明如何设计一个预测类的产品。
考点:考察候选人对于预测类产品场景化的落地经验。
思路:首先,根据应用场景不同,这类需求可以分为分类任务和回归任务,比如用户复购模型预测就是分类任务,而酒店价格预测就是回归任务。
其次就是产品经理要站在业务场景下,阐述推进 AI 产品建设的全过程,从数据准备到模型构建,再到模型验收,以及部署上线,各环节产品经理需要参与的工作,以及工作内容和评价标准(详细内容见第 27 讲)。
问题20请举例说明如何设计一个自然语言类的产品。
考点:考察候选人对于 NLP 的理解,这个问题面试官会基于具体的场景来考察候选人,比如,如何设计一个对用户评论分析挖掘的产品。
如果是基于这样的场景提问,候选人要先说明 NLP 能做什么,然后再回答其中涉及的具体工作,比如评论挖掘就会涉及用户情感分析、用户标签挖掘、用户评论相似度分析,以及评分质量打分等等(详细内容见第 29 讲)。
## 课后讨论
如果你真的参加了一场 AI 产品经理的面试,你觉得自己的核心竞争力是什么?
期待在留言区看到你的故事,我们下节课见!