【卷首语】人工智能产业的四大浪费(下)
上一周的《云栖科技评论》中,我们提到在人工智能产业的高速发展中,正不经意产生本可以避免的浪费,其中包括算力浪费、数据浪费、AI能力浪费和AI人才浪费等方面,虽然AI领域的投资仍然处在高速增长期,但浪费仍然会对产业发展产生负面影响。
存在浪费就需要有针对性的解决方案,在此提出相关建议以抛砖引玉。
首先,针对AI算力浪费来说,使用公共计算平台(公共云)所提供的算力,尤其是AI算力,是一个避免重复建设AI计算平台(硬件基础设施)的重要方式。公共云因其按需付费、资源共享的特性,可以实现公共服务天然带来的边际成本效应的降低,从而能够以更低的成本获得人工智能算力,不仅降低企业获得AI算力的成本,更能避免AI算力的浪费;
其次,就AI能力的浪费来说,公共云平台也是一个很好的选择,一方面,云平台天然解决了企业数据和技术的统一,这也构成了企业获取人工智能能力的最重要路径;另一方面,云服务商将AI能力作为“公共服务”提供,对其易用性、适用性、功能性都有所优化或强化,对于企业来说,可以更加快速和便捷地将其应用到实际业务中去。
第三,数据共享平台的建立至关重要。虽然近年来AI研究者们持续试图在小数据集上实现AI技术突破,但总体来说收效并不明显,数据仍然是AI产业发展的重要基础资源,完整、全面、准确、实时的数据非常关键。因此,建立可信、可靠、可用的服务于AI产业发展的数据共享平台至关重要,当然,这种共享平台必须要保证数据安全、信息脱敏和隐私数据保护。
最后是AI人才浪费的问题,正如上一期所说:由于在AI人才培养中,计算机学科、人工智能技术的教学未能与生物医疗、交通运输、工程建筑、脑科学等学科实现融合与交叉,造成“AI人才不懂行业,行业人才不熟AI”的局面,AI人才往往变成了“计算机学科人才”而非AI产业人才。
针对这一问题,借助跨学科教育培养新一代信息技术人才已经成为共识:2018年11月,MIT宣布在计算和AI领域投资10亿美元,成立面向全球计算和人工智能领域教育与研究的“苏世民计算学院”,该学院以培养“双学科学者”为目标,让各个学科的专家对计算和AI知识的掌握程度与他们在自己的专业领域一样熟练,从而培养“AI+专业学科人才”,从而保证AI人才在产业中可以学以致用。
1、Facebook或支付数十亿美元以了结其隐私泄露调查
【新闻摘要】 据《华盛顿邮报》报道,美国联邦贸易委员会(FTC)正与Facebook讨论,通过让后者支付总金额高达数十亿美元的罚款以了结一起由剑桥分析公司丑闻而引发的调查,有知情人士称,目前双方尚未就金额达成一致。Facebook的谈判代表对该机构提出的条款表示了担忧。如果FTC和Facebook无法达成协议,FTC可能起诉Facebook,结果可能会是被处以比双方目前正在谈判的罚款金额还要高得多的罚款。
【小云评论】2011年,Facebook签署了相关协议,承诺会对其用户的私人信息保密,但事实上却“屡次让这些资料遭到外泄”。华盛顿邮报估计,剑桥分析公司丑闻所引发的赔偿,针对每位受影响的用户,FTC最高可判处Facebook数额为41484美元的罚金。根据泄密事件牵涉到的美国用户人数,此次Facebook面临的最高处罚将达7.1万亿美元。但一般来说,类似的事件最终都以一个“Facebook可以接受的‘价格’妥协”,而这也引发了另一个担忧:如果每次都是以“合理的价格”妥协,用户隐私泄露的问题很可能根本无法得到根治。
2、加州公布2018年自动驾驶里程
【新闻摘要】 加利福尼亚州车辆管理局(DMV)日前公开了2018年度全球62家无人驾驶公司在该州的路测数据,数据报告显示,在L4级无人驾驶领域,技术成熟度与路测的总里程数成正比关系,里程数越高,技术成熟度越高,谷歌无人驾驶公司Waymo以127万英里的路测里程数夺得2018年路测里程总数冠军。通用汽车旗下的Cruise紧随其后名列第二,Apple、Zoox、Uber、Nuro、AutoX和Aurora等公司的路测里程数均超过2万英里,AutoX是唯一一家中国北京的公司。在路测里程数位列前11名的公司中,有四家中国公司上榜。
【小云评论】2017年公开数据显示,除谷歌Waymo和通用汽车Cruise之外,没有任何一家无人驾驶公司的路测里程超过5千英里,而在2018年,无人驾驶公司的前十一大路测里程的门槛则为15441英里,除Waymo外的单车年无人驾驶里程甚至已经高达4253英里(Aurora公司),过去的一年称得上是“无人驾驶路测爆发的一年”。此外值得注意的是,除通用汽车Cruise之外,传统车企的无人驾驶路测数据仍然与科技公司差距甚远,在急切追赶电动汽车差距的同时,传统车企不能忽略无人驾驶领域的投入力度,特别是具有非常重要意义的实际道路测试。
3、谷歌今年将在房地产投130亿美元
【新闻摘要】 据CNBC报道,谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)近日表示,该公司正在美国各地建设新的数据中心和办公室,并已经扩张到几个新的关键地点。为此,该公司今年在房地产方面的开支将达130亿美元,比2018年增加一倍。桑达尔·皮查伊概述的计划包括在内华达、俄亥俄、德克萨斯以及内布拉斯加等州建设新的数据中心,这是该公司首次在这些州建立基础设施。此外,谷歌还将增加弗吉尼亚州的员工数量,为华盛顿特区提供新的办公室和更多的数据中心空间,并在纽约哈德逊广场扩建纽约园区。
【小云评论】2019年以来,谷歌显著加重了在云计算领域的投注,尤其是在云计算的底层基础设施——数据中心领域,谷歌持续投入重资,显示出谷歌2019年在云计算市场取得份额突破和业务发展的雄心。谷歌此时突然加大云计算领域投入与全球云计算市场的发展趋势不无关系:云计算市场正在显著向主流的大型云计算供应商,如亚马逊AWS、微软Azure和阿里云等聚集,谷歌、IBM等处于第二梯队的云计算服务商与三大巨头之间无论是在业务增速还是在商业化程度上的差距都在加大。
4、美军为伤兵研发智能绷带
【新闻摘要】 据TechCrunch报道,为了在伤势严重、条件危险的战场上,为受伤士兵提供迅速而有效的治疗,美国国防部下属研究部门DARPA正在试图通过在“组织再生生物电子项目(BETR)”下资助合作伙伴的形式,设计出一种包括智能绷带在内的能够预测病人需求并自动做出反应的系统,从而改善战场上受伤士兵的伤口恢复效果。BETR项目经理保罗·希恩认为,理想的治疗方法是感知、处理和响应伤口状态的这些变化,并进行干预,以纠正和加快恢复,因此,智能反应系统“密切跟踪伤口的进展,然后实时刺激愈合过程,以优化组织修复和再生”的功能逻辑是可行的。
【小云评论】正如文中所说,一个简单的例子可能是,智能绷带能从通过特定的化学信号检测到伤口被某种特定的细菌感染。然后,它可以精确提供抗生素剂量,并在必要时停止给药,而不是等待医生的处方。或者,如果智能绷带检测到剪切力,然后心率增加,这很可能意味着病人正被移动,并处于疼痛中,在此情况下,它会自动释放止痛药。不仅如此,整个“治疗”过程的数据都将实时反馈给医护人员,从而加入医护人员对于伤口的专业处理意见,进一步加速恢复速度。很显然,BETR的这一想法需要人工智能的帮助:智能反应系统借助AI的能力学习基本的医疗护理和药物使用知识,从而实现“绷带智能”。
5、约6.17亿在线账户信息在暗网出售
【新闻摘要】 据国外媒体报道,从16个被黑客入侵的网站上窃取的约6.17亿在线账户信息将在暗网上销售,买家只需支付不到2万美元的比特币,就可以从Tor网络中的Dream Market网络集市购买这些被盗的账户数据。从已经放出的数据中可以看到,这些账户都是真实有效的,不仅包括账户持有人的姓名,还有其电子邮件地址和账户密码等信息。尽管这些数据经过哈希处理或单项加密,但破解起来并不是一件难事。不同的网站数据包含的信息也不尽相同,有些就含有位置、个人详细信息以及社交媒体身份验证秘钥等信息。不过这些数据中似乎并没有付款或银行卡之类的信息。
【小云评论】虽然黑客售卖的数据中目前还看不到付款或银行卡信息,但这些数据仍然有被用于“撞库攻击”(即凭据填塞攻击,实施“撞库攻击”的犯罪分子往往会使用从一个网站中窃取的用户名及密码尝试登录该用户其他网站的账户,从而获得其它有价值的信息,如信用卡信息。)的风险。但此次用户信息售卖事件最令人震惊的是:包括MyHeritage、MyFitnessPal和Animoto在内的网站在2018年确实披露过黑客入侵事件,但其他的网站却从未有过相关新闻,这意味着这些网站的用户在隐私信息被售卖前没有得到及时通知以修改登录密码、信用卡账号等关键信息,由此造成的风险可见一斑。
6、全球半导体厂商业绩“触顶”迹象明显
【新闻摘要】 《日本经济新闻》日前刊发报道称,韩国三星电子等8家主要厂商的2018年第四季度净利润合计环比下滑约3成,全球半导体厂商的业绩“触顶”迹象正在加强。该报道认为,在中国经济增速放缓日趋明显的背景下,美国苹果公司的iPhone等智能手机销售放缓,数据中心的建设热潮也告一段落。各厂商处于库存增加导致财务容易受到挤压的状况,因此开始出现减少设备投资的趋势。从数据上来看,8家主要厂商合计的净利润以2016年初为最低点,之后一直维持增长态势,到2018年第三季度达到254亿美元的顶峰。但在第四季度减少至186亿美元。除高通和英飞凌之外的6家均陷入利润下滑或亏损。
【小云评论】智能手机与数据中心建设热度的减弱,使得全球半导体厂商的库存正在增加,同时,据业界团体世界半导体贸易统计组织协会(WSTS)推算,2019年半导体市场规模增长3%,处于较低增速。当然,对于半导体厂商来说也并不都是坏消息:随着人工智能、物联网等领域的高速发展,与之对应的人工智能芯片、物联网芯片预计进入高速增长期,其市场规模很可能弥补智能手机与数据中心领域芯片需求降低的市场缺口。不过目前这些芯片的需求还未形成规模,在此之前,半导体厂商恐怕确实要过上一段时间的“苦日子”了。
7、OpenAI组织展示通用语言学习系统
【新闻摘要】 由硅谷多家公司和投资人共同成立的人工智能非营利性组织OpenAI日前发布了被称为GPT-2的自然语言处理(NLP)模型,其最大亮点是可以生成给定单词或句子的连贯文本,而且在一系列 NLP 测试中实现最佳 (或接近最佳) 性能。自然语言处理专家、Salesforce 首席科学家 Richard Socher 对《麻省理工科技评论》表示,OpenAI 这次的工作展示了一个更通用的语言学习系统,这些通用学习系统代表着未来。而OpenAI 认为,GPT-2 的诞生表明,足够大的语言模型可以在不需要特定领域数据集或修改的情况下学习 NLP 任务。
【小云评论】GPT-2引发了人们有关“AI假新闻”的担忧。此前,在没有人工制作的语法规则和精心标记的数据集辅助的情况下,AI还难以实现自然“说话”,但GPT-2的出现让这成为可能,这一强大的语言模型,可以在不需要特定领域数据集或修改的情况下学习 NLP 任务,换言之,制造“AI假新闻”,而且用作展示其能力的“AI新闻样例”已经基本上确认了它的能力。为了不让全球在未来充满“AI假新闻”,除了OpenAI以“负责任的态度发布这个模型”,以及“针对可以用来生成误导性内容的 AI 系统进行更多的审查”,充分考虑技术上的对应策略至关重要,比如使用对抗神经网络等AI技术去识别、发现“AI假新闻”。
8、摩根大通首开先例推自有加密货币JPM Coin
【新闻摘要】 摩根大通银行日前推出自有加密货币JPM Coin,这使该行成为全球第一家推出自有加密货币(数字货币)并投入实际业务使用的大型银行,也是华尔街机构拥抱区块链技术的最新大动作。据该机构称,JPM Coin主要将用于机构客户业务结算,目前其仍然是一个“原型”, 初期仅有一小部分交易使用 JPM Coin,也只有少数拥有监管合规[许可?]许可的主要机构客户才可能参与使用。摩根大通表示没有计划在这一阶段对个人客户提供服务。摩根大通旗下有规模庞大的批量支付业务,每日在全球转帐流动量超过 6 万亿美元。
【小云评论】“炒币”不是摩根大通的目标,数字货币本身也不是,对于一家金融机构来说,安全可靠的交易方式和为金融行业的发展做好准备更加重要,这正是JPM Coin的目标:摩根大通所做的是为未来全球金融交易基础建设做好准备,包含将从跨境支付到发行公司债券的业务,都转移到区块链上。因此,虽然JPM Coin与美元可以以1:1兑换,但它并不是真正意义上的数字货币,更像是一种交易支付结算等限定用途的“可信的等价标记物”,因此其应用范围将非常广阔,包括跨境支付、证券交易以及大型企业会计账务合并等。
9、2019年云计算十大趋势
【新闻摘要】 据国内媒体刊发的《2019年云计算十大趋势》显示,业内专家普遍认为,人工智能将引发巨大的商业变革,而未来衡量企业是否先进的一个重要指标就是——智能协助员工(不仅仅是服务于高管)做决策的比例。此外,企业决策层对于人工智能兴趣浓厚,但更青睐全面的智能解决方案。与此同时,在行业整体发展上,多数专家认为,随着诸多企业整体上云,云计算市场渗透率将加速提升,公有云市场集中度进一步提高。同时,巨头云计算公司会利用人才、资本、生态等多重优势,在云计算领域展开并购,并尝试向产业上游延伸。
【小云评论】以云平台为基础提供AI能力,解决了新技术普及期的一个关键问题,即如何以用户可接受的成本,在尽可能广泛的范围内,让用户快速获得先进的新一代信息技术,并将其应用到实际业务中。目前,阿里云等公有云平台已经成为客户获得最前沿的全面人工智能能力的最重要渠道,并由于云计算作为一种公共服务所带来的天然的边际成本效应降低,而能够以更低的成本获得人工智能能力。
10、IBM认为模拟芯片可为机器学习加速1000倍
【新闻摘要】 IBM研究院的半导体和人工智能硬件副总裁Mukesh Khare日前表示,目前的机器学习限制可以通过使用新的处理硬件来打破,他认为在数字AI核心和近似计算、带模拟内核的内存计算、采用优化材料的模拟核心等领域,针对AI需求设计的“AI硬件(特别是AI芯片)”可以带来飞跃式的发展。因此,IBM Research AI硬件中心正在建立广泛的AI芯片及其他AI硬件生态,其合作伙伴涵盖半导体全产业链上的公司,包括IBM制造和研究领域的战略合作伙伴三星,互联解决方案公司Mellanox Technologies,提供仿真和原型设计解决方案软件平台提供商Synopsys,半导体设备公司Applied Materials和Tokyo Electron Limited(TEL)。
【小云评论】“用硬件来解决问题”的思路在2010年前后曾经在数据库性能优化领域出现过:SSD(闪存盘)所带来的巨大性能提升,对苦于通过代码和数据结构优化来提升数据库性能的DBA(数据库管理员)们来说不啻为“天降福音”,为数据库带来了飞跃式的性能提升。但同时市场上也有反对声音认为:硬件的飞跃,助长了在软件(算法、代码和数据结构等领域)上“懒惰”,这会产生不良的后果。回到AI硬件的话题,作为AI发展的关键三要素:算法、算力和数据,仅仅算力上的增长是远远不够的,算力的提升会带来AI能力的跃升,但切记不忽略算法的重要性。