为什么说产品经理都该懂一点机器学习?

简介:
本文来自AI新媒体量子位(QbitAI)

一个普通(移动)互联网公司的产品经理,也需要懂机器学习?Quora的产品设计师Abhinav Sharma说,几乎所有设计师都需要对机器学习有一个基本的了解。

Quora虽然只是个问答网站,但机器学习技术至关重要,个性化订阅邮件、主页信息流、主题推荐、问题推送、垃圾信息过滤等方面,都用了这种技术。

先说明一点,在Quora,产品设计师和产品经理的只能有着很多重叠,我们就都叫产品经理(PM)好了。

在阅读下文之前,请先把自己想象成一个这样的人:

你的日常工作,就是各种风格、网格、布局、色彩,以及设计能够在整个网站上重复使用的模式。

你在什么地方会用到机器学习呢?

垃圾信息/质量控制系统

垃圾信息过滤器的基础是机器学习的一个基本模型:分类。分类器使用以往的数据来添加标签,判断某条内容属于垃圾信息还是正常信息。

这种系统都会犯错,有的会把善意内容归入垃圾信息(假阳性),还有的则会放过垃圾信息(假阴性)。多类别分类也是一样。

为了更好的用户体验,产品经理需要对假阳性和假阴性的情况做处理。

当某些正常内容被误标为垃圾信息时,你需要考虑的是用户会担心错过信息,或者是不是应该适时提醒他们“查看一下垃圾邮件”。

当垃圾信息被放过的时候,你需要担心的是如何向用户解释,并给他们提供反馈通道,然后处理这些问题。

通知

通知可以大幅提升互动性,对人们的行动提供反馈,但这些系统很难设计。

随着公司规模扩大,往往要开发一套系统,让不同的团队可以制作不同的电子邮件或通知,以便发送给用户。而根据之前的互动和目前的带宽,分类器则负责决定是否发送邮件。LinkedIn的邮件优化框架(http://www.kdd.org/kdd2016/papers/files/adf0710-guptaA.pdf)便是其中一例。

这类系统也存在着假阳性和假阴性的问题,在下面两种场景下出现的问题尤其值得产品经理注意:

  1. 如果我关注的某人对我的回答进行了评论,这是个非常重要的信号,我肯定希望知道,即便我没有时间回应很多其他评论。
  2. 与很早以前发表的答案相比,我可能更关心最近发表的答案所获得的反馈。

如果不想因为错过信息和失去用户信任而忧心忡忡,那就必须知道用户何时渴望确定性关系,知道系统在什么时候无法承受假阳性。

通常而言,可以用一套规则集来规定我们需要的行为,来增强机器学习系统。事实上,有很多方式对“规则”进行编码,并融入实际的机器学习系统之中。

另外,有的产品未解决这类问题走到了极端,用异常复杂的规则集完全取代了机器学习,借此来建造一个他们完全信任的系统。例如,Slack用户就利用这个流程图来判断是否向你发送通知:

信息流排序

与Twitter不同,Facebook、Quora和Netflix的的主页信息流并非按照时间顺序排列,而是根据相关性排序。这就引出了我们的第一个回归问题,机器学习算法需要尝试预测你喜欢某条内容的概率。概率在0和1之间,而参考数据则是之前观察的案例所体现出的0和1。

信息流是先筛选出可能的结果,再对它们进行排序,这可能缓解了你对归类中的假阳性和假阴性问题的担心。但是,你要考虑到影响首页信息流体验好坏的更多因素,包括新鲜度、多样性和用户最希望看到的内容。

所以负责用户体验的人,通常是产品经理,往往扮演确定目标函数的重要角色,你可以将此视作系统的最大化目标。例如,如果Facebook的最大化目标是你阅读某个帖子的概率,那就会为你展示很有趣,但却有可能过时的内容,或者很多来自同一个人的内容,同时也要考虑其他一些用户体验方面的因素。

另外,你必须要从用户那里收集正确的信号,了解他们是否真的喜欢某个内容,于是便有了接下来的……

内容行为

反馈对于这些排序系统十分重要。任何回归模型都只能针对可以衡量的事情进行优化,这就意味着你需要明确了解用户对某款产品的哪一方面要求较高,哪一方面要求较低。

这些信号可能很含蓄,例如用户在YouTube上观看视频的时间,也可能比较明确,例如在Quora上不赞同某个问题或答案的历史。要点在于这些信号必须具备以下特点:

  1. 可预测:真正说明优秀的用户体验。
  2. 明确:不要混淆意图,例如,Twitter最初的“星标”行为就是为了收藏,但实际上却被用作“点赞”。
  3. 密集使用:用户必须经常使用,才能通过数据加以分析。这就是视频观看时间等含蓄信号往往效果很好的原因所在。

解释神奇的数字

回归模型还经常被用来定价,而精明的用户想知道为什么是这个价格。比如说,Airbnb就遇到过这个问题,他们的定价模型接近线性回归,可以解释为独特性、供需关系和位置的加权求和,并用简单易懂的图表展示出来:

在更复杂的机器学习任务中,模型解释能力依然很重要,但是模型越复杂越精确,解释能力就越差。

搜索

现在,我们来说说Google。

还记得前边提到的信息流排序系统吗?Google可能是第一个涉及复杂UI的主流排序产品。

Google最开始时不是由机器学习驱动的,但现在是了。

搜索引擎需要经过层层考量才会生成最后的搜索界面,这些考量点可能包括——过滤掉成人向和暴力向内容、在复杂目标函数运算下的排序、解释元数据和搜集用户对搜索结果满意度的反馈。

但是别忘了,一个搜索引擎最关键的着力点还在于识别用户意图。如你所见,当用户搜索电影时,他可能想要的是电影的内容介绍、上映时间、新闻评论、花絮集合或是其他信息。

在这种情况下,产品经理需要了解什么样的意图组合能最大限度满足用户的需要,并依此设计可以满足不同可能的UI系统。

相关内容的呈现

机器学习也被应用于网页相关内容的推荐上,最典型的做法就是把它作为一个回归问题来处理,使用户点击相关链接的可能性最大化。

以上图的YouTube为例,在一个关于日本历史的视频之后,它推荐的内容中有一条是《颠覆认知:狼族再起》。这两者之间毫无关系,只是YouTube恰好知道用户可能愿意点击这条视频,可能是因为用户之前浏览过类似内容。

YouTube试图在确保有的“相关内容”确实相关的同时,呈现你喜欢的内容,并在这两者之间找到一个平衡,甚至还严谨得将“相关视频”更改为“下一条”。

声音与对话

聊天机器人(Chatbots)曾风靡一时,但自然语言理解和语音合成技术都还处在婴儿期。对于产品经理来说,与团队一起探索语音系统的局限性至关重要。

举个例子,让机器人记住上下文内容依然是非常困难的,而语音合成技术最近终于达到了接近人类的水平。

自然语言领域的技术进步迅速,值得产品经理持续关注,上周做不了的功能,说不定这周就可以实现了。

文案

最后一点,无数研究致力于个性化的产品显示,可能很多用户根本不知道他们收到的内容是基于个性化定制的。

所以,细节很重要,比如说将“头条故事”改成“为你推荐的头条故事”,或者在UI里找个合适的地方写上用户的名字。

最后,让我们再看看文章开头的疑问:为什么产品经理需要对机器学习有一定的了解?以上,就是一份综合但不详尽的答卷。机器学习在产品设计中无处不在,但意义非凡。

本文作者:李杉 安妮
原文发布时间: 2017-04-18
相关文章
|
机器学习/深度学习 自然语言处理 算法
每个产品经理都应该知道的机器学习术语
公司正在上马AI项目?想要熟悉机器学习的世界,想要了解所有关于机器学习的术语,看看本文吧!
6415 0
|
机器学习/深度学习 TensorFlow 算法框架/工具
|
机器学习/深度学习 算法 数据挖掘
|
6月前
|
机器学习/深度学习 存储 搜索推荐
利用机器学习算法改善电商推荐系统的效率
电商行业日益竞争激烈,提升用户体验成为关键。本文将探讨如何利用机器学习算法优化电商推荐系统,通过分析用户行为数据和商品信息,实现个性化推荐,从而提高推荐效率和准确性。
239 14
|
6月前
|
机器学习/深度学习 算法 数据可视化
实现机器学习算法时,特征选择是非常重要的一步,你有哪些推荐的方法?
实现机器学习算法时,特征选择是非常重要的一步,你有哪些推荐的方法?
119 1
|
6月前
|
机器学习/深度学习 算法 搜索推荐
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
|
6月前
|
机器学习/深度学习 数据采集 算法
解码癌症预测的密码:可解释性机器学习算法SHAP揭示XGBoost模型的预测机制
解码癌症预测的密码:可解释性机器学习算法SHAP揭示XGBoost模型的预测机制
314 0
|
6月前
|
机器学习/深度学习 数据采集 监控
机器学习-特征选择:如何使用递归特征消除算法自动筛选出最优特征?
机器学习-特征选择:如何使用递归特征消除算法自动筛选出最优特征?
924 0
|
6月前
|
机器学习/深度学习 人工智能 算法
探索机器学习中的支持向量机(SVM)算法
【2月更文挑战第20天】 在数据科学与人工智能的领域中,支持向量机(SVM)是一种强大的监督学习算法,它基于统计学习理论中的VC维理论和结构风险最小化原理。本文将深入探讨SVM的核心概念、工作原理以及实际应用案例。我们将透过算法的数学原理,揭示如何利用SVM进行有效的数据分类与回归分析,并讨论其在处理非线性问题时的优势。通过本文,读者将对SVM有更深层次的理解,并能够在实践中应用这一算法解决复杂的数据问题。
85 0
|
6月前
|
机器学习/深度学习 分布式计算 算法
大模型开发:你如何确定使用哪种机器学习算法?
在大型机器学习模型开发中,选择算法是关键。首先,明确问题类型(如回归、分类、聚类等)。其次,考虑数据规模、特征数量和类型、分布和结构,以判断适合的算法。再者,评估性能要求(准确性、速度、可解释性)和资源限制(计算资源、内存)。同时,利用领域知识和正则化来选择模型。最后,通过实验验证和模型比较进行优化。此过程涉及迭代和业务需求的技术权衡。
106 2
下一篇
无影云桌面