Bingo大战:决胜大数据时代

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

必应(Bing)又一次成为了IT行业的新闻焦点。这次,它以强大的自信发起了一场名为“必应搜索,全球PK赛”的活动,主要针对谷歌PK搜索结果的质量。

据媒体报道,“第三方独立调研机构统计结果显示,中国有75%的参与者首选微软必应提供的结果”。我抱着对这个结果将信将疑的态度参与了这项测试,也许因为之前有多年使用Google的缘故。反复几次之后,有了比较深入的切身体会。刚开始的时候,我输入一些普普通通的词汇,两者搜索结果的区别不大,胜负难分,仅仅在结果排序上表现出其背后的算法差异。随着我对一些敏感词汇和热点关注的时事话题进行搜索PK的时候,高下可以说立现了。诸多事件,诸多主角,搜索结果都是惊人的一致:必应能够立即在不引起争议的前提下,有选择性地给出有价值的答案,帮助搜索者达到了解事件和人物信息的最终目的,而谷歌则一律拒绝显示搜索结果(经直接进入谷歌尝试,结论一致)。无论某轮奸事件的主角,还是更具时代争议的重庆人物,等等等等,都是如此。

从这里我得出结论,无论从算法上,还是对中国市场的了解上,必应都胜出一筹。那么,应该是时候从谷歌移民必应了。讨巧的是,把这场活动双方的首几位字母连成一个单词,居然是Bingo!

整个IT行业都在高谈阔论大数据,探讨大数据带来的营销变革,憧憬大数据将要滋生的机器智能,几乎没有人回过头去关注大数据产生的麻烦。如何从浩如烟海的数据海洋中筛掉数据垃圾,寻求自己真正想要的答案,这个问题重新回到搜索引擎这个生活学习工作都无法离身的“传统”工具上来。微软资深副总裁张亚勤这样指出:“大数据要求人们改变对精准性的苛求,转而追求混杂性;要求人们改变对因果关系的追问,转而追求相关关系;这种思维的转变将是革命性的”。

查全率是第一代搜索引擎的竞争关键,所以Yahoo和AltaVista成为了90年代的佼佼者;查准率是第二代搜索引擎的核心任务,所以Google和百度脱颖而出。而在大数据时代,全和准都不是问题了,“价值”这个更加模糊更加人性化的东西成为了搜索引擎的核心竞争尺度。在大数据的背景下,抛弃直接因果和纯粹逻辑,拥抱鱼龙混杂的数据结构和纵横交错的关系脉络,是下一代搜索引擎所不得不具备的典型特征。而这一点,必应让我们感受到了。还记得微软几年前的那个“人立方”吗?虽说只是一个好玩的东西,但其实背后我看到的恰恰是微软对大数据的尊重和人类思维模型的不懈探索。

英国经济学家霍奇逊曾在《现代制度主义经济学》一书中表达了这样的观点,“最大化的进化论,或者说最优行为的达尔文机制是以理性主义行为观为基础的”;但“无论从方法论、心理学、社会学和政治学哪个方面来看”,理性主义都陷入了“自相矛盾”,因为“认知和思维过程的复杂性以及需处理的信息数量,对理性思维来说,都面临着信息太少和资料太多的矛盾”。需要解释的是,霍奇逊这里所讲的“资料太多”就是我们今天的大数据,而“信息太少”的“信息”则是指经过有效处理之后的信息,类似于搜索结果。

鲍尔默前不久表示:“微软数据中心基础设施中服务器的数量已经超过了100万台”。有好事者对此颇有微词,指责其耗电量惊人,“能够为美国2万3千户家庭供电”。此观点实在荒唐,退回到爱迪生时代,说不定足够给全世界的家庭供电;再上溯到刀耕火种的年代,连电都不用,那么这个换算出来的家庭数量该是无穷大吧?在我看来,如此海量的服务器恰恰说明微软为大数据时代的搜索做足了准备。

另外,凡是参悟人生的人都有体会,自身就是一个小宇宙。机器也是一样,大数据不仅仅应该包括向外的互联网,也必须考虑向内的局域网和本地硬盘。记得二十年前,上G就已经称得上是那个年代的大数据了,而今呢?据我所知,从Windows8.1开始,必应不仅对互联网数据进行搜索,也同时对本地和局域网内的数据通过整合方式进行搜索,这一点,也是必应比谷歌更尊重用户、尊重数据的一个侧面表现。


本文转自 瞬雨 51CTO博客,原文链接:http://blog.51cto.com/soorain/1257777


相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
传感器 人工智能 运维
【年终特辑】看见科技创新力量 洞见时代创业精神—交通物流—欧卡智舶:无人驾驶,让水域更美好
【年终特辑】看见科技创新力量 洞见时代创业精神—交通物流—欧卡智舶:无人驾驶,让水域更美好
144 0
|
人工智能 供应链 前端开发
【年终特辑】看见科技创新力量 洞见时代创业精神—数字农业—星猿科技:用科技感知农业,以技术促进行业转型
【年终特辑】看见科技创新力量 洞见时代创业精神—数字农业—星猿科技:用科技感知农业,以技术促进行业转型
138 0
|
人工智能 关系型数据库 Go
互联网经济的全民时代,背后的X86服务器冰火两重天
互联网经济的全民时代,背后的X86服务器冰火两重天
互联网经济的全民时代,背后的X86服务器冰火两重天
|
新零售 供应链 搜索推荐
备战3年!阿里惊现超级物种,又一行业将迎来大颠覆!
阿里的犀牛智造,也有意在打造独角兽企业,强大,独特。
133 0
备战3年!阿里惊现超级物种,又一行业将迎来大颠覆!
|
运维 安全 网络安全
互联网金融或将在净化中迎来新机遇
互联网金融或将在净化中迎来新机遇
148 0
互联网金融或将在净化中迎来新机遇
|
搜索推荐
李彦宏分享百度危机中如何“弯道超车”,互联网营销
2007年底世界开始出现金融危机,最后导致大范围经济危机。很多人认为这是一场70多年来从未见过的经济大萧条,感觉无所适从。百度也感受到这场危机,尤其是2008年第四季度和今年第一季度,看到金融危机影响了我们的业务。
1378 0
下一篇
DDNS