从2015年的“大数据行动纲要”到2016年的“十三五规划”,大数据都被作为重点被提及。尤其是2016年,政府提出各个省市三年之内必须上大数据业务,导致各省市政府全部都在部署与大数据相关的业务。这快速地推动了政府行业在大数据方面业务地发展。
“大数据平台其实是智慧城市大脑,政府更需要大数据,比如数据打通后,进京证可以通过手机来办理。此外,还有医挂号等事务的办理。这些都需要我们的大数据平台。”东方金信CEO王伟哲介绍道。
深挖政务领域需求
王伟哲表示:“政府部门对于政务大数据平台的需求非常强烈。我们在政府里面做的第一件事情就是建立人口库。输入姓名,你能看到该公民家族图谱,一生从出生到上学,再到结婚买房等等变化曲线。并且,你可以了解这些人有什么样不动产和动产,甚至个人、企业之间是否的关联和担保关系,都可以通过一张相似的图谱来显示。此外,在医院数据导入进来以后,医务人员可以通过此类图谱了解到病患的家族遗传病史,对病患进行相应地救治。”
据了解,从2013年成立至今,东方金信业务覆盖的行业越来越广泛。在行业比例上,金融行业客户大概占东方金信的40%左右,政府占40%左右,其他的行业大概加起来占20%左右。
王伟哲表示:“如果从一个城市对整个的大数据的投入上来说,我们的这些软件和这些数据业务占政府应用系统的比例仍然比较低,大概十分之一左右。一个城市如果充分应用大数据,一个城市的投入大概应该是在三亿元到五亿元之间。我们的软件,就是帮政府管理者整合数据,并且将报告进行前端展示。这些需要的资金大概占政府总体大数据投放的比例的10%左右,其余基本上都是硬件建设。”
建立标准打通孤岛
当下,很多数据的格式标准都不尽相同。此外,各部门之间也会由于业务不同、利益不同等诸多原因导致很多数据被束之高阁,无法有效利用。比如,在一个银行里,可能会存在几十甚至上百个不同的业务。那么如何将这些数据进行定义,形成统一的标准,使数据更方便地导入导出,进而进行分析、挖掘。
王伟哲认为:“在一些业务比较多的单位里,可能会存在几百套系统单元,数据要对接到这么多的数据平台里,非常费力。东方金信曾经为一些客户,设定了两千九百多个数据标准。”而这些标准是需要和客户进行长期沟通,共同建立的。王伟哲补充道:“我们要和业务部门去确认业务场景,以及业务数据是什么。其实数据标准其实有很多种,一种是按数据存储长度,比如身份证是十八位。而有些身份证里边有字母,这也是一种标准。身份证代表一个人的个性属性,是我的唯一标识,就是业务属性,它就是一种标准。所以,这种标准非常多。”
为此,东方金信建立了专门系统来完善制定数据标准的流程。这个系统就是按照方法论来运作的,东方金信有一套标准的流程来定义这些数据标准,数据标准的审批流程和通过流程都通过该系统来顺利完成。
“师”从谷歌专修技术
作为一家专注于大数据平台和大数据解决方案的企业,东方金信从事的就是把数据业务放在自主研发的分布式架构平台上。
分布式架构其实是由谷歌提出,谷歌有上百万台服务器。这些服务器没有采用IBM、Oracle、EMC这些知名厂商的数据库和存储设备来解决问题,而是采用了的分布式架构来解决数据问题。东方金信的核心产品脱胎于Google分布式大数据平台,专注于企业级高性能分布式大数据解决方案和云解决方案。
东方金信是一家纯技术类的公司,王伟哲介绍说,从人员比例看,公司总人数里,销售、市场、财务和人力人员总共不超过10%,其他全部从事技术研发和产品客户化研究。东方金信核心团队来自Google、美国银行、Teradata、IBM、阿里、腾讯等全球著名企业的核心数据开发人员,具有丰富的分布式研发能力和数据分析挖掘能力。
目前,东方金信的研发团队可以独立编译底层代码,优化大数据平台,并和中国科学院大学合作成立大数据研发中心,和北京交通大学合作成立铁路大数据研究中心。
王伟哲表示,公司在未来最大的愿景是“希望我们的产品能做得更好,SeaBox大数据平台整体解决方案能为更多的行业用户提供帮助,为客户带来更多的价值,将来会有更多的客户使用SeaBox大数据平台。”