数梦工场:我们帮你实现你驾驭数据的梦想

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

 6月4日,在第七届中国云计算大会上,数梦工场总裁王巍介绍说,数梦工场的数就是大数据,数梦工厂在大数据的基础上实现云架构;梦就是中国梦,数梦工厂解读中国梦为青山绿水、人民幸福、政治安定和经济繁荣;第三,数梦工场的员工绝大多数都是工程师,用数据技术来助力中国梦的实现。并且数梦工场秉承三个关键词,基于飞天、面向政企和场景化的开发和服务。

以下为采访实录:

记者:大家好!欢迎收看本期的视频节目。我们今天仍然是在第七届中国云计算大会的现场。坐在我左手边的嘉宾是数梦工场的总裁王巍先生,可能大家对数梦工场这个品牌还不是很熟悉,我想首先请王总给我们做一个简单的介绍。

王巍:好的,数梦工场是在杭州西湖区的云溪小镇,名字就把我们要做的事情基本概括了,数就是大数据,我们是在数据基础的这个基础上来实现一些价值。第二个是中国梦的梦,中国梦我们把它解读为青山绿水、民生幸福、政治安定和经济繁荣,数据技术可以在这些领域多做一些助力工作。第三个是工程师,我们绝大多数人都是工程师,研发工程师占了65%,其他基本也都是售前、售后的一些工程师,这些工程师要用数据技术来助力中国梦的实现。场就是一个创新的战场,也可以叫创新梦场。内部来讲的话,我们内部很放养的,是一种尊重个人和小团队创新的这样一个环境,但是外部的话,其实整个创业也是一个战场。我们实际上是用DT技术,就是用数据技术来圆相应的一些梦想。

我们有三个关键词,第一个关键词是基于飞天。数梦工场跟阿里云是在4月份签定了使命级战略合作伙伴关系。我们现在飞天作为自己的核心云的平台来做事情。第二个,面向政企,不是传统的消费类的,也不是传统的电子商务类的,而是面向政企各行各业,因为所谓的“互联网+”就是拿互联网的一些核心能力输出出去,到百行百业来做各个行业的基础设施和创新工具,我们选择就是政企的百行百业。第三个是场景化的开发和服务,场景化的开发服务,云是作为一种资源、一种能力,但是它不是直接产生总体价值,如果要产生总体价值,必须要把应用的一些能力,必须要把一些服务的人力,必须要把基础设施所涉及到的一些投入的财力,必须把数据整合所需要的一些权利做场景化的一些整合性开发和服务。基于飞天,面向政企,做场景化的整合式的开发和服务就是我们的一个定位。

主持人:那是不是可以这么理解,我们的公司是不是没有自有的一个传统意义上的专属的自己的IT基础设施,我们的基础设施其实都是基于云的,也就是说基于阿里的这样一个飞天系统?

王巍:可以这样去理解,因为这个稍稍有一点抽象,因为原来要么是一个设备厂商,要么是一个运营厂商,但是在DT时代,它最缺的往往不是已有的,因为厂商已经很多了,不是构建级的厂商,运营商也蛮多,也不是启发这种运营商,而是缺乏一种场景化的创新。举一个例子,一个省级政务云,它是需要一种环境的,这个环境,你比如像浙江省,他是没有买任何一个设备,也没有建任何一个机房,就拥有了全世界最先进的云和大数据能力。它这种云和大数据能力是什么呢?是中国电信提供的这样一个环境,这种环境是专门给省级政务云去用的,它也区别于以前的公有云,可以把它理解成叫专有云,就是专门给它去用的。这个云里面运转的是飞天平台,这个需要基础设施的飞天平台给它架构好,上面我要跑什么?比如要跑政务淘宝,政务淘宝就是把传统的政务的运作像淘宝店一样的,4000多个机构我们把它像淘宝店一样的,把政务的公共服务产品像商品一样,在上面来进行运行。这里面还要进行相应严格的安全的管控,实现数据集中和安全的一次平衡,还要进行必要的一些数据库整改,把原来异构的数据库同构到飞天上的IDS和DIDS上。大家可以看,在整个的过程,它不是一个简单的交钥匙过程,把相应的一些产品集成到那里就可以了,这里面有大量的平台的优化、管控、调优、增值,有大量的工作,这种服务我们用一个词把它抽象,叫BAAS,是一种后台去服务的这样一种提供。我们需要有一个专门的工程师队伍提供全站式能力和零距离的服务,这个就是我所提的,确实场地不是我的,是中国电信的,飞天的操作系统是阿里的,服务器是华为的,或者浪潮的,应用可能是蓝鲸大汉的,或者是其他软件开发商的,但是我们在这里面整个管控平台、整个BAS,整个架构设计,其实这一份工作量是整合创新里面还是比较重的这一块。

记者:从你刚才说的描述中,我想能不能跟我们具体地来说一下你的业务的堆栈都包括哪些层面的东西?比如说我们刚才也谈到了基础设施或者说云平台的管理这一块,可能不是你们自己的,你们跟别人来合作,那你们自己的这种产品技术堆栈都体现在哪些层次上?

王巍:好的,我跟大家说一下,底层是风火水电、机房环境,这是中国电信的,上面一层就是网络和服务器,就这两类设备,蛮简洁的。

记者:对,这叫IT基础设施。

王巍:华为的、浪潮的都可以这一层。再上面一层是什么?是三个最核心的构建,一个是弹性计算,这是阿里的。还一个是分布式数据库,也是阿里的,都是飞天的构建。还有一个是大数据,像ODPS这也是阿里的。面向政府的话,政府的应用要申请资源,要进行管控,要进行相应的一些安全计费,这个上面要有一个管控平台,管控平台我来开发的。再上面具体的还有支撑政府的数据的一种合并和开发,涉及到大数据分析这一侧,我们基于ODPS,要形成服务数据目录,要把它进行归并,要设置各种策略,最终形成可用数据,支持万众创新,这个你可以理解成一种服务,也涉及到一定的开发。政务淘宝对接也要形成一个中间键平台,也要进行开发,然后把这些应用都支撑好,最后形成一个完整的政务云的服务界面。所以我这样来表达吧,就是说底层的环境层、设备层和平台层实际上是做了三层的水平整合,在上面具体一些应用,要做应用整合,要开发一个管控平台,管控平台是让我们去做的,要做大量的服务工作,所以我叫场景化的开发和服务,主要是产生这两类的服务价值。有的时候是要把它集成为产品的,就像今天推出一体机,一体机是什么呢?一体机就是说我把所有的这些分层的东西,把它进行纵向整合,直接把它调优成最佳的效率,比如数据库一体机,能够把所有的异构数据库搬迁同构到这儿来,大数据一体机,所有的ODPS跟硬件给它调优,在政府的具体场景里边。因为我可以这样讲,其实长远来讲,可以看得出来,数梦工场管控平台,包括其他的,是偏行业PaaS层,因为PaaS并没有一个标准的PaaS适用于百行百业。其实不同行业因为数据都不同,需要服务的模式也不同,算法也不同,其实大的行业都会有自己相对应的场景化的PaaS平台。那我之前有一句话,就是说数梦工场我不会做别人已经做得很好的事情,别人已经把服务器做得很好了,交换机做得很好了,连机房线路都搞得很好了,飞天的基本管控的操作活动搞好了,这个不要做了。我就说为什么我觉得当前其实云计算、互联网+的过程当中面临的最大困难到底是什么?就是这些技术整合完之后,能在具体行业产生真正价值,而这个真正价值是依赖于一个PaaS分平台和相应的一些应用整合和管控的,我们就做这些工作,包括必要的这些服务工作。

记者:所以说你刚才也谈到,你说你不做那些别人已经做得挺好的东西了,但是乍一听,一体机好像也是很多厂商都在做的,所以我们的一体机到底跟别的厂商的一体机到底有哪些具体的不同呢?

王巍:一体机这个概念是很宽泛的,一体机比如说把安全的能力分装在一起,也叫一体机,叫安全一体机,有的把具体的某一类应用就分装在一起,ERP的应用都分装在一起,也叫一个一体机,有的只是数据库一体机。实际上一体机是按照应用场景和它的功能去区分的话,是有很多很多门类的。奥睿科也有一体机,SAP也有一体机,华为也有一体机,惠普也有一体机,都有一体机,我们跟别人的不同的是什么呢?比如数据库一体机,数据库一体机的话,我们用的是阿里的RDS和DRDS。这个一体机的话可以讲它的主要特点是什么呢?第一,如果你用的是分布式的海量数据库,它是一种分布式数据库,它的能力是很强的。因为今天会上我也在讲,既然阿里也不是因为光成倍原因要去奥睿科,而是因为奥睿科在支持它各种库的时候,因为太大了嘛,太大了以后的话,其实奥睿科的能力上限达不到海量数据库应用的下限,所以它要替代。成倍原因也是其中的一个原因之一,所以有一类市场它就像按凯普(音)理论的话,如果你确实对一致性和可用性要求极高的情况下,高频交易,然后又做了大量的存储过程等等,那我是觉得用奥睿科蛮好的。但是有一些可能他对可用性和可扩展性要求特别高的时候,这个时候分布式数据库是最好的。这个时候它的优势就发挥出来了。

所以这个一体机我可以这样讲,阿里是基于自己前台应用的实践,无论是支持淘宝,还是支持支付宝,它有一个很优秀的分布式数据库,把它分装起来,为什么分装起来的话,一体机要做大量的软件和硬件调优,分装出来的话,用到某一类,实际上要做某一类的一些调优工作,硬件参数很多,软件参数也很多,调优完了以后,这一类普遍地去推送,其实这个就是一种产品形态。但是你看的话,你会发现我用的是华为的服务器、浪潮的服务器,计费肯定也不是我自己做的,软件,这里面的功夫还是在于场景化的调优和增值,也会开发10%左右的相对应场景的门户管控类的,也会做相应的开发。

记者:这又回到您刚才谈到的业务模式,又有点比较好奇的一点,比如说您刚才谈到浙江政府,他自己也没有采购任何的机房设备,没有采购任何的IT基础设施,都是通过一种云、大数据的服务来获得相应的能力,如果你以后也是这种一体机了,开始以这种感觉像一种卖设备的套路来做,按你刚才的那种商业模式的话,又会是怎么样一个具体情景?

王巍:这个我跟你解释一下,因为很多时候大家把公有云和私有云,把它很对立,非此即彼,其实它们都是云,云是什么?是一种超级计算能力,是一种公共计算服务能力,这里面这种计算服务能力它的对象,它的对象可以是全世界人民,也可以是这个地球上的局部人。之所以这样的话,一方面是因为安全的原因,也有一些云的集中性和网络的局限性,也有一丝博弈。所以我可以讲,如果谁买票都可以上的,这其实就是公共汽车,但是只有公安才能上的那是公安的班车,因为我们不能说有公共汽车了,可能某些行业就不能有班车。这个里面是要达到什么呢?达到安全与数据集中的一次平衡,也达到效率和集约性的一次平衡。所以一体机我可以这样讲,一体机并不是说这个资产就一定要归属,因为现在还有大量的像PPP的建设模式,资产可能归于投资者,它只是被租用的。政府的话,因为他最在乎的是什么?我们反复地去跟政府客户聊,你真的在乎拥有一个固定资产吗?重资产部分你真的在乎吗?还是最后你在乎的是数据资产?以及数据资产所产生的这么一个价值,那OK,其他东西都可以不拥有、去租,但是有一个数据一定是有一些部门一定要牢牢把握在自己手里。还有一个,我可以讲,就目前来讲,数据的资产是没有严格的法律依据的,比如你去做个CT,你的数据到底是你的还是医院的?搞不清楚,有很多搞不清楚的时候,真的有些数据你掌握了,就像有一些零售类,掌握了我们的用户名、手机号和我们的麦克地址,你就可以交易吗?对吧?所有的快递,快递数据可以交易吗?如果快递公司想把我们的数据交易出去,可以吗?我是觉得直觉是不可以的。所以我是觉得这里面有大量的安全管控,大量的一些界限,它并不是在线,真的在的互联网所有人都能看到这个线,还是一个很严肃的事情,这个世界我认为百分之六七十以上的价值数据是暂时不能在线到所有全人类的范围内,可能只能在线到特定企业和特定行业这个范围内。所以部分地方,你要非得说它是一个私有云或专有云,也行吧,它也是一种公共服务,不矛盾。

记者:您刚才也谈到数据库,感觉阿里一直在强调去IOE,好像你们也是一个去O的一个主要的推手,可以这么理解吗?

王巍:我认为是这样的,我自己是做DB2出身的,对奥睿科也有一些了解,我觉得很多技术是蛮优秀的,但是任何一个技术,我搞这么多年的话,我知道,任何一个技术并不是所有的场合都是性价比最优的。所以我不喜欢“去”这个词,这个世界上谁去谁呀?实际上我喜欢可能有时候弱一下,有些不必要去用的,第一种不必要,可能性价比不是最优的,是用户选择替代一次。还有一个可能这种数据库架构在能力上,可能在互联网场景里面,在互联网+过程当中,能力不匹配,那就不是替代,是取代,它已经做得很好了,又不涉及到一些安全的问题,那就接着去做,干吗,我没想一定要去人家。

记者:所以结合场景来做。

王巍:还是结合场景来做,我觉得最终做决定的是客户,我们只是跟客户去解释一下,现在我们所推出来的这个产品,它到底是具备什么样一个能力,得用户去做选择。

记者:最后一个问题,还是想结合您公司本身,您刚才也谈到了,一直在做一种场景化的服务。能不能给我们举个例子,比如说你的实际的案例,去比较鲜明地体现出你这种场景化。比如说你现在能拿出几个比较典型的应用场景或者政企,或者说这种企业的应用场景,或者说在实际案例中有哪些场景发挥的作用,带给了客户哪些价值?大概也给我们说一下。

王巍:你比如说在政务应用当中的话,它有的时候就涉及到什么呢?涉及到了效率问题,比如要迁到云上,迁到云上之后的话,数据库要去异构,要同构,这个时候你所有的应用过来,它的整个CQ1G的效率实际上不一定是最高的。我曾经举过一个例子,有一个地方大型网站压力很大,用工程师调优两天,整个性能提高4倍。但意味着什么?那个网站是花两三亿建的,提高4倍就意味着这些工程师几天之内是创造了八九亿的性价值,我是觉得这实际上是一种场景化服务。就是一些应用过来,因为应用开发商有很多嘛,对于这个环境怎么样能把效率提到最高,比如CQ1G的调优,第二个,天天涉及到安全问题,安全问题是个动态的问题,怎么样能够把最新的防攻击手段,最新的防漏手段,不断地去给它做加固。第三个,可能人家的原代码都没有一个很好的管理机制,能不能给人家提供一种原码的管理服务。第四个,能不能帮助人家去做新的大数据的一些算法支撑和一些辅助工作。因为现在可以讲大数据对于很多单位来讲是很新鲜的,所以你会发现,我自己总结是什么呢?整个过程交不了钥匙,它是不停地在做咨询、建设、维护、调优、增值,这五个动作不停地循环着在做。这整个一个过程,我之所以叫场景化的开发和服务,是需要一批专家在这种重要场景里边长期的驻扎的,长期地去服务的,这跟以前卖了产品可以基本上离场是不同的。

记者:好,非常感谢王总今天能接受我们的采访。其实感觉您刚才说的最后总结的那五点循环,好像感觉这个梦一直要做下去,跟以前的《盗梦空间》我要做几层的梦的感觉一样。但是我觉得有这个梦总比没有这个梦要好一些。再次祝愿我们的数梦工场能在王总的带领下,能让更多人实现他们的数据的梦想。谢谢王总。 

原文发布时间为:2015年7月6日


本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网


相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
数据采集 移动开发 物联网
【年终特辑】看见科技创新力量 洞见时代创业精神—文旅娱乐—易游无限:数字技术负载文化传统,赛博空间筑牢精神家园
【年终特辑】看见科技创新力量 洞见时代创业精神—文旅娱乐—易游无限:数字技术负载文化传统,赛博空间筑牢精神家园
148 0
|
新零售 人工智能 供应链
案例酷 | 干了这碗鸡汤!老乡鸡规模扩张的数智化底气
编者按: 2003年,老乡鸡在合肥开了第一家店,18年过去了,如今老乡鸡在全国一共超过1000家门店,拥有国内中式连锁快餐最大的门店规模。
341 0
|
运维 供应链 搜索推荐
响铃:云计算“飞轮效应”显现,腾讯、阿里领跑没有悬念
响铃:云计算“飞轮效应”显现,腾讯、阿里领跑没有悬念
333 0
响铃:云计算“飞轮效应”显现,腾讯、阿里领跑没有悬念
|
人工智能
水滴筹的2018:飞速进化,不改初心
水滴筹的2018:飞速进化,不改初心
368 0
水滴筹的2018:飞速进化,不改初心
|
新零售 双11
8成服饰品牌与阿里云合作,国货崛起平均增收24%
2020年12月18日,在第二届阿里巴巴ONE商业大会上,阿里巴巴副总裁、阿里云智能新零售事业部总经理肖利华透露,8成知名服饰企业已同阿里云合作,其中国货品牌崛起,收入平均增速24%。
350 0
8成服饰品牌与阿里云合作,国货崛起平均增收24%
新动能支撑2/3新就业,创业是如何发挥就业倍增效应的?|创业带动就业观察(二)
在中央及各地方政策的推动下,创业带动就业倍增效应持续显现。 800万返乡创业者带动3000万就业,新动能支撑2/3新增就业。“新旧动能持续转换,新动能持续增长,对新增就业的支撑达到了2/3的支撑能力。”人社部新闻发言人在此前的新闻发布会公开表示。
周末荐书 | 连续54年盈利!这家企业的持续发展是怎样实现的(赠书)
宫内义彦同欧力士集团风雨同舟50载,带领并见证了企业的每一步发展,在长达50多年的管理实践中积累了宝贵的企业管理经验,《我的经营论》正是作者毕生经验的结晶,企业持续发展的秘密就蕴藏其中。
961 0
|
程序员
博士程序员感慨互联网行业太累,想进事业单位被网友批:浪费人才
一名计算机博士毕业后在互联网行业从事程序员工作,但随着年龄的增长,感觉越发吃不消了:坐标北京,36岁的博士程序员,技术一般,在互联网公司工作的很吃力,且加班多,身体有些吃不消,现在有一个机会进北京公立医院,有事业编制,收入估计只有现在的一半多一些,不知道该不该去。
1843 0
|
安全 中间件 大数据
实力说话,Aliware 生态联盟前锐力量——数梦工场再登高峰
7月5日,阿里云 Aliware“铂金合作伙伴”授牌仪式在云栖小镇成功举办,阿里云企业业务事业部总架构师王晶昱、阿里巴巴中间件事业部合作生态专家徐政参加了授牌仪式。数梦工场企业事业部总经理段云飞、数梦工场企业事业部技术总监戴霖、数梦工场阿里云业务部总监吴昊参加了此次授牌仪式,吴昊从沈询手里接过了授权牌。
3633 0