据英国广播公司(BBC)近日报道,看不见的算法正在掌控着我们与数字世界的互动,从谷歌网站上图书、电影和音乐的算法到Facebook网站上推荐朋友的算法;从操纵华尔街交易的代码再到各种搜索引擎代码,算法似乎无声地渗入到我们的世界并重塑着我们身处的世界。
然而,令我们揪心的是,我们正在慢慢失去对这些代码的控制,而且,算法也并不总是正确,算法出错将会给我们的生活带来巨大的影响。在上个月举行的全球TED大会(指全球技术、娱乐、设计大会,每年,TED大会在美国召集众多科学、设计、文学、音乐等领域的杰出人物,分享他们关于技术、社会、人的思考和探索)上,算法专家凯文·斯莱文警告称,现在,到了我们更透彻地了解算法并想方设法“驯服”它的时候了。
“算法为王”
斯莱文在全球TED大会上发表演讲称,“计算机用来做决定的数学”正在以“随风潜入夜,润物细无声”的方式,慢慢渗透进我们日常生活的方方面面。
在每个智能网页的背后都隐藏着更加智能的网页代码:谷歌网站上为我们推荐图书、电影和音乐的是算法;Facebook网站上为我们推荐朋友的也是算法;在华尔街纵横捭阖的是算法;在好莱坞预测票房的也是算法。
这些看不见摸不着的计算正在慢慢掌控着我们与电子世界的相互交流,这是一个“算法为王”的时代。“我们正在编写一些自己也看不懂的东西,我们把一些事情变得更加复杂,难以理解。我们正在慢慢失去对这个我们自己创造的世界的理解和掌控。”斯莱文警告称。
算法影响好莱坞
随着代码变得越来越复杂,它的触角正在深入我们生活的各个层面,包括我们的文化偏好。
推荐引擎是全球最大的在线影片租赁网站Netflix公司的一个关键服务,1000多万顾客都能在一个个性化网页上对影片做出1到5的评级。Netflix将这些评级放在一个巨大的数据集里,该数据集容量超过了30亿条。Netflix使用推荐算法和软件来标识具有相似品味的观众对影片可能做出的评级。
百分点推荐引擎的首席执行官柏林森表示:“网络正从一个搜索时代进入一个发现时代,推荐引擎无所不在。当人们并不十分清楚需要某个东西存在,或者不完全清楚自己的具体需求时,推荐引擎能帮助他发现自己所需要的东西。这就是Netflix影片推荐引擎的成功所在。”而且,两年来,Netflix还使用举行大奖赛的方法来提高影片推荐的效果,2010年Netflix大奖的获奖团队成功地将Netflix的影片推荐引擎的推荐效率提高了10%。正是基于此, Netflix现在承担了全球60%的电影网上租赁业务。
无独有偶,英国电影公司Epagogix也正在将电影的剧本、情节、明星、拍摄场地等各种要素集合在一起,使用其自行研制出的算法预测电影的票房收入。该公司首席执行官尼克·米尼表示:“这套系统将帮助制片公司决定是否制作一部电影。只需要你将剧本提交给我们,我们就可以算出这部电影的票房收入为多少。”
比如,他举例说,如果一部电影的预算成本为1.8亿英镑,但是,算法计算得出,其票房收入可能只有3000万英镑,说明这部电影并不值得投资开拍。
很多电影人对这种算法深感困扰,米尼自己也表示:“拍摄电影的原因很多,我们的算法只是帮助人们更好地做决定,何乐而不为呢?”
斯莱文表示:“重点在于,上述种种例子并不是谷歌,也不是信息,不是金融统计,而是文化,算法正在形成改变我们文化的物理学。”
算法掌控华尔街
在金融领域,代码的地位也越来越重要,颇有“代码为王”的架势。现在,华尔街70%以上的交易依靠所谓的黑盒子或者算法交易(闪电交易)运行。银行家和股票经纪人也闻风而动,他们不仅招聘聪明的交易员,还大量雇佣聪明的物理学家和数学家。斯莱文说:“现在,有2000多名物理学家在华尔街工作。”
算法出错,影响巨大
或许在某些方面,算法要比人聪明,但并非总是如此,由人编写的算法也并非永远正确。
《苍蝇诞生记》是一本分子生物学方面的书籍,主要讲述的是一只苍蝇从卵到完全成长为幼虫的过程,尽管这本书可能非常吸引人,会给人带来美好的阅读体验,但它无论如何也不值2360万美元的售价。然而,今年年初,这本书在亚马逊网站上的标价确实高达2360万美元,造成这一情况的主要原因是亚马逊公司的定价和改价算法开始互相竞标。
“这是算法在没有人监管时的自相矛盾。”斯莱文表示,当代码变得足够聪明,在无人干预的情况下很可能会经常出现这种混乱。
算法失误也曾导致美国华尔街股市崩盘。在2010年5月6日发生的所谓“2:45的瞬间崩溃”中,美国股票市场的9%消失了5分钟。
一名马虎的交易员因为道琼斯指数下降10%受到了指责,但其实,这名交易员当时正在使用的计算机程序才是“罪魁祸首”。短短20分钟之内,这个算法将7.5万股股票以26亿英镑(约为42.57亿美元)的价格抛售,导致其他高频交易算法如法炮制,股市9%的财富瞬间消失,所有人目瞪口呆。没有人知道究竟发生了什么事情,然而,几分钟之后,市场恢复正常。
所谓成也萧何败也萧何,交易算法在让交易更加方便快捷的同时,也承担着巨大的风险,千里之堤毁于蚁穴,小小的错误可能就会带来致命的打击。这就促使监管者必须引入断路器,在机器开始表现失常,算法出错时果断将交易终止。
算法将我们困于“过滤泡沫”中
谷歌公司的秘密代码将其推上全球最有实力的公司之一的宝座。确实,这些代码使得搜索变得更加容易,然而,也不断有科学家对谷歌公司的算法提出批评。
MoveOn.org董事长埃利· 帕雷瑟在其所写《过滤泡沫》一书中表示,当前,我们使用互联网的方式正悄然发生着巨大的变革,诸如谷歌这样的搜索引擎提供的信息也日益个性化,这些互联网过滤器会记录用户可能会喜欢的对象,并试图以此进行预测。这些过滤器实际上是一种预测引擎,它会持续不断地建立和完善一个预测机制,来推断你是什么样的人,你将要做什么,你下一步想要什么。经过整合以后,这些引擎将为每个人创建一个独一无二的信息世界,并将其称为“过滤器气泡”,它将从根本上改变我们获取观点和信息的方式。
然而这种个性化的数字“过滤器气泡”会产生一个危险且意想不到的后果:它们正限制着我们获取信息的途径和方式,使我们对新闻和文化的视野变得愈加狭隘,最终将对我们的日常生活和民主产生负面影响。
而且,美国哥伦比亚科学家的最新研究表明,依靠搜索引擎获取答案实际上改变了人类的思维方式。该报告的作者、哥伦比亚大学的心理学家贝琪·斯帕罗表示:“自从搜索引擎问世后,人们就开始调整自己记忆信息的方式。我们的大脑依靠互联网来记忆,就像依赖朋友、家人或同事来记忆信息一样。现在,我们几乎很少通过记住信息本身来记忆,而是更多地通过记住在何处找到这些信息来记忆。”
而且,斯帕罗表示,人们更容易记住在互联网的何处能找到这些信息,而不是记住信息内容本身。
速度高于一切
华尔街的算法可以看成是上世纪80年代涌现出的“雅皮士”(住大城市、具有知识技能、讲究生活品味的青年职业人士)的网络版,只不过,华尔街的算法需要的不是雪茄、香槟,而是快速的运输通道。
斯莱文解释道,因为华尔街的算法依赖于一个高于一切的特质:速度,它们的运行时间以毫秒和微秒计算(点击一下鼠标,要花50万微秒),如果你是一个华尔街的算法,落后5微秒,你就是失败者,因此,科学家们正在绞尽脑汁提高速度。
美国延展网络(Spread Networks)公司正在打造一条高速的光纤连接,该公司正在美国纽约市和芝加哥市之间铺设一条825英里(1327公里)长的电缆线,其最终目的是将股票交易加快3微秒。凯文·斯拉文表示:“我们正在用炸药和岩石锯打穿美国,让算法能早3微秒完成交易,所有的一切都是为了一个前所未有的通讯系统。”
另外,一条连接加拿大新斯科舍省和英国索默塞的光纤连接已被建立起来,以满足股票交易员的需要,在60毫秒内在伦敦和纽约之间发送股票数据。
随着算法开始将其影响力延伸,并塑造我们身处的世界,现在,到了我们透彻地了解算法并想方设法对其进行“驯化”的时候了。
原文发布时间为:2013-11-15
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号