暂无个人介绍
在2013年的Hadoop峰会上,YARN是一个热点话题,YARN本质上是Hadoop的新操作系统,突破了MapReduce框架的性能瓶颈。Murthy认为Hadoop和YARN的组合是企业大数据平台致胜的关键。
张亚勤:微软公司资深副总裁、微软亚太研发集团主席 大数据这个话题,从西到东,从IT业内到政府官员,已经火了两年,但还没有完全一致的定义。目前业界一般认同Gartner的描述,即:凡是具有“3V”特性的数据集,就是大数据。
即将逝去的2013年,被认为是具有跨时代意义的“大数据元年”。在这一年,数据比以往任何时候都要宝贵,甚至成为可以与石油资源相媲美的新能源,大数据被认为是继信息化和互联网后整个信息革命的又一次高峰。
这是一则惊心动魄且无比真实的故事。 1990年5月26日早上6∶10,型号为BAC-1-1的英航5390班机和往常一样,从伯明翰机场准时起飞,它的目的地是西班牙马拉加机场。机长是拥有21年飞行驾驶经验的西蒙,副驾驶员则是刚来5390上班的阿拉史泰尔,除此之外,飞机上还有一名乘务长和3名空姐,以及84名乘客。
联想之星和创客总部举办了一个主题为“寻找下一个移动互联网爆发点”的小型沙龙。在这次会上,不仅宣布了由联想之星创业联盟成员企业和北大校友共同发起的创业孵化器创客总部成立,还邀请联想之星投资总监刘维、IDG资本合伙人李丰、天天动听CEO黄晓杰、墨迹天气CEO金犁等人进行了演讲,从不同角度对移动互联网的未来发展趋势和可能出现的爆发点进行讨论。
分享一下最近我们在EMC Global Services的一些工作成果。我们的目标是绘制一张「大数据的故事图」,用来帮助客户们更好地理解大数据之旅。 我们试图用各种比喻和主题提供一个图形化的教材,帮助我们的客户理解,在实施大数据的过程中一些关键的要素。
工具类厂商蓄意炒作大数据,以达到售卖产品的目的,但导致的结果是很多人对大数据这一概念云里雾里。实际上,大数据就发生在你我身边,虽然你看不到它,但它却时时影响着我们的生活。现阶段,和大数据相关的企业有三种。
大数据已经成为影响各行各业的热词,鉴于中国庞大的用户基础,对中国企业而言,大数据的影响也更为深刻。 2013年8月6日,Splunk公司在北京举办了探讨大数据如何落地的研讨会,分享了大数据给各个领域带来的变革、大数据技术在中国落地的前沿观点以及Splunk大数据方案的实施案例。
第五部分:进阶工具 如果你准备用数据可视化做一些“严肃”的工作,那么你可能不会对在线可视化工具或者web小程序有太大兴趣,你需要的是桌面应用和编程环境。 16. Processing Processing是数据可视化的招牌工具。
每个人都知道互联网改变了企业经营、政府运作以及人们生活的方式。但是一种新的、不那么明显的技术趋势却有着同样巨大的变革能力,那就是“大数据”。大数据的趋势发端于下面这个事实:如今到处传播的信息比以往任何时候都多出了许多,而且这一趋势正在应用于非同寻常的新用途。
智能可穿戴设备无疑是目前最为热门的话题之一。被称为“互联网女皇”的美国知名风投KPCB分析师玛丽·米克尔(Mary Meeker)在今年的互联网趋势报告中,尤其强调了智能可穿戴设备的增长潜力,认为这是下一个热门领域。
如今学习应用数据可视化的渠道有很多,你可以跟踪一些专家博客,但更重要的一点是实践/实操,你必须对目前可用的数据可视化工具有个大致了解。以下是Netmagzine列举的二十大数据可视化工具,无论你是准备制作简单的图表还是复杂的图谱或者信息图,这些工具都能满足你的需要。
几天前,我一个朋友收到了之前在Indiegogo 上众筹的运动监测设备Misfit Shine 。这个99美元纽扣般的小东西一出来就令人震惊了,它就像一个纽扣一样,外形优雅简单、很轻、防水,可24小时戴在身上,能跟踪走路、跑步或睡眠信息,放在手机上即可完成同步,可以显示时间,几乎不用换电池。
经济人杂志总能找到一些跟中国相关的新奇观点。最近的一篇文章指出中国的高房价跟性别比例相关。原因是没有婚房的男屌丝们基本上是找不到老婆的,于是在男性比女性多的地方,男同学当然要削尖脑袋买房结婚,价格就当然上涨咯。
F1赛车如今也掀起节能环保改革,赛车发动机将从V8引擎缩水到V6,但又不能牺牲速度,又让马儿跑,又让马儿不吃草,这个经典难题只有通过大数据分析才能解决。 F1赛车场可能是大数据最经典的应用场景之一,一辆辆风驰电掣的造价高达200万美元的F1赛车的设计、模拟、测试和建造完全在电脑中完成,这个流程的每个环节都将产生大量数据。
2013年8月7日市场研究公司尼尔森公布最新报告称,Twitter用户可提高电视节目的收视率,原因是这些用户会在收看电视节目的同时发布实时共享评论。 在对200多个黄金时段电视节目进行分析后,尼尔森得出的结论是,有关一部电视剧的Twitter消息数量的激增将可在近三分之一的时间里提高收视率;反之亦然:越多观众收看一部剧集,就会有越多Twitter用户发布实时评论。
我对数据挖掘和机器学习是新手,从去年7月份在Amazon才开始接触,而且还是因为工作需要被动接触的,以前都没有接触过,做的是需求预测机器学习相关的。后来,到了淘宝后,自己凭兴趣主动地做了几个月的和用户地址相关数据挖掘上的工作,有一些浅薄的心得。
首先说明一点,本文中提到的UED基本都指交互设计 一、为什么需要数据验证? “天天看到你们也挺忙的,但是怎么衡量游戏用户体验提升了多少。” 是的,高层对战略方向关注的更多,不可能了解每个员工所有的工作细节,尤其是我们是做用户体验的。
博主致力于研究R语言在数据挖掘方面的应用 与数据挖掘有关或者有帮助的R包和函数的集合。 1、聚类 常用的包: fpc,cluster,pvclust,mclust 基于划分的方法: kmeans, pam, pamk, clara 基于层次的方法: hclust, pvclu
近几年,新兴通信业务对传统通信运营商构成了很大的威胁,在竞争过程中,并购、重组等大的战略调整屡见不鲜。如何保证大量广告宣传和营销服务的投入效果,保持业务优势,是传统通信运营商考虑的重中之重;其中,客户资源维持是提升其利润率和APRU值(每用户平均收入)的重要标志,客户流失率则是运营商最终ROI(投资回报率)评估的重要参考系数,因此客户关系管理在传统通信运营商的管理环节中显得尤为重要。
美国一家名为 Reputation 的网站即将发布一款可以让人们出售自己的隐私数据换取折扣或者好处的产品,终于可以用自己的数据换点零花钱了。 互联网已经固定的商业模式:大公司通过收集用户的隐私数据来为企业提供收费服务以支撑公司发展,同时以免费的网络服务来补偿用户。
从事互联网广告行业的人喜欢讲述这样一个笑话:一天早上,某门户网站老总怒气冲冲地找来广告总监,训斥道:你怎么能让这些情趣用品的广告放到我们的网站页面上?后者一声不吭,默默地回到办公室。
国内可穿戴设备创业团队Flashunit闪点继推出“DGC”模式后,其联合创始人翟飞再次提出“人体IP”这一创新观点引爆了圈内热议。他认为,每个个体都是独立的数据源,能够不断产生各种不同的人体数据,这些数据能够推动可穿戴设备的进一步发展,为大数据市场组成了不可替代的庞大细分市场。
所谓关联,反映的是一个事件和其他事件之间依赖或关联的知识。当我们查找英文文献的时候,可以发现有两个英文词都能形容关联的含义。第一个是相关性relevance,第二个是关联性association,两者都可以用来描述事件之间的关联程度。
汽车后市场的大数据在哪里?我认为可能有三个来源。 其一是来自社交媒体。 微信、微博,这些平台会有大量文本数据、语音数据,经销商与顾客的每一次交谈、微博里的每一条信息、微信里的每一次互动对话,通过合适的语音、语义挖掘,都可能发掘消费者与消费行为的相关关系。
数据科学家被《财富》杂志誉为21世纪最性感的职业,但遗憾的是大多数企业里都没有真正的数据科学家人才。根据麦肯锡报告,仅仅在美国市场,2018年大数据人才和高级分析专家的人才缺口将高达19万。此外美国企业还需要150万位能够提出正确问题、运用大数据分析结果的大数据相关管理人才。
20世纪中期,著名奥地利经济学家约瑟夫·熊彼特(Joseph Schumpeter)提出了「创造性破坏」的理论,以此表示伴随根本性创新而发生的转型。近些年来,我们的世界已经「熊彼特化」了。数字化设备大规模高强度的渗透我们的日常生活,我们也因此根本性、一次性的改变了彼此之间,以及与我们整个社交网络的沟通方式。
据国外研究机构的数据显示,全球大数据市场将在未来五年内迎来高达26%的年复合增长率,即从今年的148.7亿美元增长到2018年的463.4亿美元。据预测,到2020年全球数据量将扩大50倍,大数据时代已经来临。
自4月29日阿里入股新浪以来,外界开始揣摩马云花5.86亿美元要去干什么,一边倒的观点认为,马云是看中了新浪微博的数据。 但最关键的问题是,马云要用这些数据去干什么。是大多数人猜测的用来做简单的营销+导流吗?NO!阿里浪联姻最大的价值在于,需求预测模型的构建。
凤凰科技讯 2012年9月29日消息,“智慧城市”——2012北京国际设计周专题展在北京中华世纪坛开展。本次展览,展出了来自14个国家82件信息设计作品。这些作品,利用数字可视化方式,使人们可以通过一张3D动态图表,便直观的了解到发生在我们身边的事件。
守势 从去年9月,马云正式提出阿里的未来的平台、金融、数据之后,银行始终处于守势。最有行动力的金融机构的玩法也不过是跟进、模仿互联网公司们的创新,或与之合作。上周,东方证券的分析师金鳞发了一份名为《互联网改变金融》的深度研究报告,就是在为银行们分析互联网与金融未来的共生竞合的新生态,写得很好,但视角也仍是跟金融机构们讨论怎么防守。
对平台上的卖家来说,如何给宝贝取标题、选择关键词投放对于获取站内站外的搜索流量来说都至关重要,而对于独立B2C来说,在显示搜索结果时,除了根据商品关键词进行匹配外,还可以向用户主动推荐关联商品。 在选择商品关键词时,卖家可以从四个途径下手:站外投放热词、站内搜索热词、商品属性以及行业数据。
亚太地区智能手机普及率扩张迅速。实际上,该地区一些市场智能手机的普及快要达到饱和点,已经超越了美国和很多欧洲国家的普及水平。 虽然尼尔森期望沟通设备的用户增长开始达到平衡,但是消费者对这些设备的使用将继续演进和扩大,这给组织机构显示出巨大的机遇,得以在一个几乎无所不在的平台上与消费者接触。
从所周知,大数据已经不简简单单是数据大的事实了,而最重要的现实是对大数据进行分析,只有通过分析才能获取很多智能的,深入的,有价值的信息。那么越来越多的应用涉及到大数据,而这些大数据的属性,包括数量,速度,多样性等等都是呈现了大数据不断增长的复杂性,所以大数据的分析方法在大数据领域就显得尤为重要,可以说是决定最终信息是否有价值的决定性因素。
如果Google最终败诉,那么我们可以做出这样一个推论,小米协助用户分享并明文存储Wi-Fi密码的做法在美国将被判违法。 小米共享Wi-Fi密码的闹剧刚刚结束,Android系统的领导者Google又因在2010年通过街景车非法采集用户Wi-Fi数据而面临司法调查和集体诉讼,而案件的最新进展对Google相当不利。
随着投资的跟进,大数据的市场表现有点低于市场的预期。由于媒体的一再宣传,很多企业开始在大数据领域进行投资,而其实很多企业其实并不明白大数据究竟为何物。一份分析报告指出,投资大数据带来的回报,低于投资人的预期,甚至出现了回报低于本金的现象。
为什么谈到大数据,传统企业表现出更多的困惑?其原因是,企业决策者并不清楚大数据能给业务带来哪些价值,也不知道如何学习、使用大数据分析工具。而这些大数据工具就摆在那里,谁能先一步学习使用,谁就占有先机。
电子商务相对于传统零售业来说,最大的特点就是一切都可以通过数据化来监控和改进。通过数据可以看到用户从哪里来、如何组织产品可以实现很好的转化率、你投放广告的效率如何等等问题。基于数据分析的每一点点改变,就是一点点提升你赚钱的能力,所以,电子商务网站的数据分析是很重要的一门功课。
禾讯科技的业务是利用卫星遥感技术,掌握全球耕地分布,监测大宗作物的长势与估产。它的主要客户是农产品期货公司等,大宗作物的产量是这些公司的命根子。以往的情形是,相隔上万里的期货公司获得的信息并不客观,禾讯科技研发的“全球在线农情监测系统” 能够更新数据,并通过自己建立的分析平台得知农作物的长势与产量情况。
这是SAP赞助的“未来商业"系列文章的第一篇。 Kensho Finance公司正在开发基于云计算的超级数据处理技术,这将改变金融机构依赖Excel做市场行情建模的方式,未来,普通金融机构有可能拥与顶级对冲基金相媲美的复杂市场模型和计算环境,散户也不例外。
为什么这个渠道的数据很好,可就是不盈利呢?是我的产品有问题呢?或是渠道作弊?这还真是让人头疼。行业关于渠道作弊这块分享的信息真是太少了,各CP只能跌跌撞撞,靠自己摸着石头过河,那这回我们一起走进数据的世界,用数据说话,拨开迷雾辨真伪吧。
拥有更多的财务数据后,CFO如何做好企业的“晴雨表”和“预警器”? 《萨班斯-奥克斯利法案》推出以及全球经济处于长期波动性和不确定性的影响下,企业的风险管控更加复杂。作为与数据打交道、用数据说话的财务高管,如何在大数据时代,收集、分析、挖掘与财务相关的数据,改进工作效率与效益,获得业务发展的洞察? 大数据时代下,CFO的职能已经从财务管理延伸到提升企业整体绩效,从而企业财务也要随之转型,即通过高效的财务流程对企业的现金流、收购兼并、资源配置、风险管控等进行管理,利用大数据等分析工具获得深度洞察,将资源更好配置在增长领域。
一些企业正在利用新兴技术来应对新的数据源,但大多数企业仍然面临着需要努力管理好他们已经掌握或者应当掌握的数据信息的困境,而当他们试图部署大数据功能时,发现自己还需要面对和处理新的以及当下实时的数据。
摘自FT中文网,感谢民生银行刘燕撰文并推荐。 2013年,中国的商业银行经历了诸多冲击:经济下行导致行业风险上升、轰轰烈烈的“互联网金融”要颠覆传统的垄断格局、利率市场化进程在“十八大”后加速、各种行业进军银行业。
“希望大家先准备好智能手机,等候通知,让我们一起期待‘见证奇迹的时刻’。” 又是一封流传到外部的“内部邮件”,作者为平安集团董事长马明哲。 所谓奇迹,指2014年1月才会上线的一款电子钱包,据称它既可以作为社交工具,也有理财功能,能把支付、转账、汇款等结合在一起。
虎嗅F&M;创新节的“如何洞察用户:阿里与宝洁的大数据实战”专场里,阿里巴巴数据委员会会长车品觉、宝洁中国市场研究部总经理李霈、英特尔中国研究院首席工程师吴甘沙和股票雷达创始人冯月聊到一个很有趣的话题:作为传统公司,宝洁很羡慕阿里能够轻易收集到真实、实时、全面的的数据,但车品觉却说,大数据公司对数据处理同样存在两个难点: 第一大数据太大,大数据公司跟传统公司一样需要做“采样”的工作。
在以毫秒为计算单位的交易市场,高频交易似乎已经笑傲江湖难逢对手,但是华尔街的武器库远不止如此,还有一种可以窥探市场走势的“神器”也受到了交易员的热捧。 这些“神器”包括直升飞机、热感摄像机、传感器等等,虽然并不罕见,但他们有一项特殊的任务:专门为华尔街收集情报。
商业推动了IT不断向前发展,云计算就是一个有趣的例子。甲骨文CEO拉里·埃里森曾经对近两年大行其道的云计算表示不屑,因为云计算并不是一项新技术。但迫于市场竞争的压力,甲骨文还是在2011年推出了云计算战略。