如果你是商界英才(而不是数据科学家或者机器学习专家),你也许对主流媒体宣传的人工智能(artificial intelligence,AI)已经耳熟能详了。你在《经济学人》和《名利场》杂志上读过相关文章,你看到过特斯拉自动驾驶的煽情文章,听到过史蒂芬•霍金讲述人工智能威胁人类的耸人听闻,甚至迪尔伯特关于人工智能和人类智能的玩笑你都知道。
此时,胸怀大志要把自己的生意做大做强的你,面对媒体关于人工智能的碎碎念,可能萌生了两个疑问——
第一,人工智能的商业潜力是真是假?
第二,这玩意怎么用到我的生意上?
对第一个问题,答案是:千真万确。今天的商业活动,可以开始应用人工智能来将要求人类智能的活动替换为自动处理以降低成本。人工智能可以允许你将一个需要人海战术的工作通量增加100倍而成本减少90%。
第二个问题的答案要长一些。首先得消除主流媒体鼓吹导致的误解。一旦误解消除,我们才能为你介绍如何应用人工智能到自己的生意中去。
◆ ◆ ◆
误解一:人工智能是魔术
多数主流媒体将人工智能描述为神奇而神秘的。我们只需为大魔术师般的公司,如Google,Facebook,Apple,Amazon和Microsoft等鼓掌欢呼即可。这样的描述只是在帮倒忙。如果我们想要人工智能应用到商业活动中,至少需要让公司的执行官们理解它。人工智能不是魔术。人工智能是数据、数学、模式和迭代。如果我们想要人工智能应用到商业活动中,我们必须更加透明,并解释清楚人工智能的3个互相连锁的关键概念。
1.训练数据(TrainingData,TD)——
训练数据是机器可以用来学习的起始数据集。训练数据有输入值和自带答案的输出值,这样机器学习模型可以从答案中寻找模式。比如,输入可以是客服单,带有客户和公司的客服代表之间的电子邮件。输出可以是基于公司某个分类定义的从1到5的分类标签。
2.机器学习(MachineLearning,ML)——
机器学习是软件从训练数据中学习到某种模式,并把它应用到新的输入数据中。比如,一个新的客服单,带有某位客户和某位公司客服代表的邮件来了,机器学习模型可以预测出一个分类,告诉你它对该分类的把握有多大。机器学习的关键特征是,它不是通过固定的规则来学习。因此,当它消化新的数据后,它会调整其规则。
3.人机回圈(Human-in-the-Loop,HITL)——
人机回圈是人工智能的第三个核心成分。我们不能指望机器学习万无一失。一个好的机器学习模型大概只有70%的准确性。因此你需要一个人机回圈流程,当模型的可信度低时,还可以依靠人。
因此,别被人工智能的神话愚弄了。现在,有了人工智能的公式,在此基础上,你可以对人工智能有一个基本的理解了。AI = TD + ML + HITL
◆ ◆ ◆
误解2:人工智能是给科技精英用的
媒体报道似乎暗示,人工智能只是科技精英的菜——只有像Amazon,Apple,Facebook,Google,IBM,Microsoft,Salesforce,Tesla,Uber这些公司能斥上亿美金巨资组建庞大的机器学习专家团队。这个概念是错的。
今天,十万美元即可在商业过程中开始应用人工智能。因此,如果你的公司是全美营业额在5千万美元以上的26,000家公司之一,你就可以投入营业额的0.2%,来启动人工智能。
因此,人工智能不只属于高科技公司。它属于任何行业。
◆ ◆ ◆
误解3:人工智能只解决亿万美元级的大问题
主流媒体叙说的故事,通常是未来式的例子,比如无人驾驶汽车,无人机投递包裹。Google,Tesla和Uber这些公司投入了数亿美元争夺无人驾驶汽车领域的领先地位,因为“赢者通吃”的想法在作怪。这样的故事给人工智能打上了“花费亿万美元开拓创新领域”的烙印。但事实并非如此。
人工智能也可以用几百万美元来解决现有问题。让我解释一下。任何生意的一个核心任务都是了解客户。这在最早的市场——古希腊的阿格拉如此,在古罗马的竞技场里面对面做买卖时如此,在网购盛行的今天也如此。许多公司坐拥非结构化的客户数据宝库,有电子邮件,也有Twitter评论。人工智能可以用于解决客服单分类或者理解推文情感这样的难题。
因此人工智能不止是为了解决如无人驾驶汽车这样的亿万美元级“让人兴奋”的新问题,它也可以解决百万美元级的现有“无聊”问题,如通过客服单分类或者社交媒体情感分析来了解你的客户。
◆ ◆ ◆
误解4:算法比数据更重要
主流媒体对人工智能的报道偏重于关注机器学习算法,将其视为最重要的部分。主流媒体似乎把算法与人脑等同了。他们隐约传达着这样一个信息:复杂的算法最终会超越人类的大脑并创造奇迹。媒体拿机器在国际象棋和围棋比赛里击败人类的故事作为例子。而且他们主要关注“深度神经网络”和“深度学习”,以及机器是如何做出决策。
这种报道给人的印象是,一个公司要想应用人工智能就需要聘请机器学习专家来建立完美的算法。但如果一个企业没有思考如何获得高质量的算法,即使机器学习模型经过大量的特定训练数据学习之后,仍然会产生一个与期望(“我们有一个伟大的算法”)不匹配的结果(“我们的模型的准确率只有60%”)。
现如今,没有计划或训练数据的预算就从微软,亚马逊和谷歌购买商业机器学习的服务,就像买一辆无法接近加油站的车,只是买了一块昂贵的金属。汽车和汽油的类比有些不贴切,因为如果你给机器学习模型的训练数据越多,机器学习模型就会越准确。这就像不断给汽车加油,汽车的燃料利用率会不断提高。训练数据对于机器学习模型的重要性比汽油对汽车的重要性更高。如果想深入了解对这类误解性的报道的话,你可以阅读我们以前的帖子《更多的数据击败更好的算法》。
所以关键就是训练数据的质量和数量至少是和算法一样重要的,要确保你部署人工智能的计划和预算反映这一点。
◆ ◆ ◆
误解5:机器>人类
在过去的30年里,无论是施瓦辛格在《终结者》里扮演的电子人杀手,还是艾丽西亚·维坎德在《机械姬》里扮演的智能机器人伊娃,媒体一直喜欢把人工智能描绘成比人类更强大的机器。媒体想编写一个机器对战人类谁会成为赢家的故事,这是可以理解的。但却歪曲了事实。
例如,最近谷歌DeepMind 的 alphago战胜韩国棋手李世石的报道被简单地描述成机器战胜人类。这样的表达不是对真实情况的准确描述。更准确的描述是机器加上一群人打败了一个人。
消除这种误解的主要理由是机器和人的技能是互补的。从上面的图中我们可以看出机器在处理结构化计算方面有优势。机器擅长“找到特征向量”的任务,不太擅长“找到豹纹裙”任务。人类在识别意义和背景上具有得天独厚的优势。人类很容易“找到豹纹裙”,但在“找到特征向量”方面跟机器相比不具有优势。
因此,正确的框架是要意识到在商业情景下机器和人是互补的。人工智能是人和机器共同工作。
◆ ◆ ◆
错误6:人工智能是机器取代人类
主流媒体为了关注度喜欢描绘一个反乌托邦式的未来,这种情况可能会发生,但这种描述对正确理解人和机器如何共同工作产生了不利的影响。
例如,让我们再思索下分类支持票据的业务流程。现如今大多数企业都还是百分百人工操作的。结果就是不仅进度缓慢而且成本线性增长,限制了工作量。现在想象一下用模型分类10,000张支持票的准确度是70%。30%的错误是不能接受的,就需要人机回圈的参与。你可以设置可接受的置信阈值为95%并且只接受模型在置信水平不低于95%时的输出。所以最初的机器学习模型可能只做了一小部分的工作,比如说5-10%。但是,随着新的人为标记的数据被创建,并且将其反馈到机器学习模型中,模型会不断学习并提高。随着时间的推移,该模型可以处理越来越多的客户支持票据分类工作,分类票据的业务量可以显著提高。
因此,人和机器共同协作可以增加业务量,保持质量,减少重要的业务流程的单位成本。
这就消除了人工智能是机器代替人类的误解。事实是,人工智能是关于机器增强人类的能力。
◆ ◆ ◆
错误7:人工智能=机器学习
主流媒体带给人们的最后一条根深蒂固的误解就是人工智能和机器学习是等同的。这个误解就导致了不切实际的管理期望—从微软,亚马逊或谷歌公司购买商业机器学习的服务就能神奇地将人工智能运用到生产中。
而除了机器学习之外还需要训练数据和人机回圈才有可能找到可行的人工智能解决方案。
没有训练数据的机器学习就像一辆没有汽油的汽车。既昂贵又无用。
没有人机回圈的机器学习是不会有好的产出的。机器学习模型需要人的参与来去除低的置信度预测。
因此,如果你是一个想把人工智能应用到业务上的执行官,现在你应该对它有一个认识框架了。你应该用人工智能的7个真理来代替这7个误解。
真相1:人工智能=训练数据+机器学习+人机回圈
真相2:人工智能属于任何行业
真相3:人工智能可以用几百万美元来解决现有的商业问题
真相4:算法并没有比训练数据的数量和质量更重要
真相5:机器和人是互补的
真相6:人工智能是机器增强人的能力
真相7:人工智能=训练数据+机器学习+人机回圈
原文发布时间为:2016-10-06
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号