东方金信专注大数据平台开发 构建智慧城市大脑

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:
+关注继续查看

从2015年的“大数据行动纲要”到2016年的“十三五规划”,大数据都被作为重点被提及。尤其是2016年,政府提出各个省市三年之内必须上大数据业务,导致各省市政府全部都在部署与大数据相关的业务。这快速地推动了政府行业在大数据方面业务地发展。

“大数据平台其实是智慧城市大脑,政府更需要大数据,比如数据打通后,进京证可以通过手机来办理。此外,还有医挂号等事务的办理。这些都需要我们的大数据平台。”东方金信CEO王伟哲介绍道。

深挖政务领域需求

王伟哲表示:“政府部门对于政务大数据平台的需求非常强烈。我们在政府里面做的第一件事情就是建立人口库。输入姓名,你能看到该公民家族图谱,一生从出生到上学,再到结婚买房等等变化曲线。并且,你可以了解这些人有什么样不动产和动产,甚至个人、企业之间是否的关联和担保关系,都可以通过一张相似的图谱来显示。此外,在医院数据导入进来以后,医务人员可以通过此类图谱了解到病患的家族遗传病史,对病患进行相应地救治。”

据了解,从2013年成立至今,东方金信业务覆盖的行业越来越广泛。在行业比例上,金融行业客户大概占东方金信的40%左右,政府占40%左右,其他的行业大概加起来占20%左右。

王伟哲表示:“如果从一个城市对整个的大数据的投入上来说,我们的这些软件和这些数据业务占政府应用系统的比例仍然比较低,大概十分之一左右。一个城市如果充分应用大数据,一个城市的投入大概应该是在三亿元到五亿元之间。我们的软件,就是帮政府管理者整合数据,并且将报告进行前端展示。这些需要的资金大概占政府总体大数据投放的比例的10%左右,其余基本上都是硬件建设。”

建立标准打通孤岛

当下,很多数据的格式标准都不尽相同。此外,各部门之间也会由于业务不同、利益不同等诸多原因导致很多数据被束之高阁,无法有效利用。比如,在一个银行里,可能会存在几十甚至上百个不同的业务。那么如何将这些数据进行定义,形成统一的标准,使数据更方便地导入导出,进而进行分析、挖掘。

王伟哲认为:“在一些业务比较多的单位里,可能会存在几百套系统单元,数据要对接到这么多的数据平台里,非常费力。东方金信曾经为一些客户,设定了两千九百多个数据标准。”而这些标准是需要和客户进行长期沟通,共同建立的。王伟哲补充道:“我们要和业务部门去确认业务场景,以及业务数据是什么。其实数据标准其实有很多种,一种是按数据存储长度,比如身份证是十八位。而有些身份证里边有字母,这也是一种标准。身份证代表一个人的个性属性,是我的唯一标识,就是业务属性,它就是一种标准。所以,这种标准非常多。”

为此,东方金信建立了专门系统来完善制定数据标准的流程。这个系统就是按照方法论来运作的,东方金信有一套标准的流程来定义这些数据标准,数据标准的审批流程和通过流程都通过该系统来顺利完成。

“师”从谷歌专修技术

作为一家专注于大数据平台和大数据解决方案的企业,东方金信从事的就是把数据业务放在自主研发的分布式架构平台上。

分布式架构其实是由谷歌提出,谷歌有上百万台服务器。这些服务器没有采用IBM、Oracle、EMC这些知名厂商的数据库和存储设备来解决问题,而是采用了的分布式架构来解决数据问题。东方金信的核心产品脱胎于Google分布式大数据平台,专注于企业级高性能分布式大数据解决方案和云解决方案。

东方金信是一家纯技术类的公司,王伟哲介绍说,从人员比例看,公司总人数里,销售、市场、财务和人力人员总共不超过10%,其他全部从事技术研发和产品客户化研究。东方金信核心团队来自Google、美国银行、Teradata、IBM、阿里、腾讯等全球著名企业的核心数据开发人员,具有丰富的分布式研发能力和数据分析挖掘能力。

目前,东方金信的研发团队可以独立编译底层代码,优化大数据平台,并和中国科学院大学合作成立大数据研发中心,和北京交通大学合作成立铁路大数据研究中心。

王伟哲表示,公司在未来最大的愿景是“希望我们的产品能做得更好,SeaBox大数据平台整体解决方案能为更多的行业用户提供帮助,为客户带来更多的价值,将来会有更多的客户使用SeaBox大数据平台。”






原文发布时间为:2017年2月21日
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。
相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
4月前
|
移动开发 运维 监控
低代码开发云平台源码,支持多种企业应用场景,快速构建CRM、ERP、OA、BI、IoT、大数据应用程序
基于 moleculer 微服务架构开发,提供微服务的应用开发、配置管理、服务注册与发现、服务认证与授权、服务网关、服务监控、统一日志分析等,提供微服务应用的开发、部署、监控、运维等应用生命周期管理。
低代码开发云平台源码,支持多种企业应用场景,快速构建CRM、ERP、OA、BI、IoT、大数据应用程序
|
5月前
|
存储 SQL 分布式计算
Maxcompute拉链表应用(一)在数据开发中使用拉链表
最新在项目中进行存储优化的一个事情,于是就又把拉链表抬出来了。
6918 0
|
5月前
|
XML JSON 大数据
大数据ETL开发之图解Kettle工具
大数据ETL开发之图解Kettle工具
102 0
|
6月前
|
SQL 分布式计算 Cloud Native
带你读《企业级云原生白皮书项目实战》——5.2.4 SQL开发参考
带你读《企业级云原生白皮书项目实战》——5.2.4 SQL开发参考
|
6月前
|
SQL 分布式计算 Cloud Native
带你读《企业级云原生白皮书项目实战》——5.2.6 数据开发及任务调度(上)
带你读《企业级云原生白皮书项目实战》——5.2.6 数据开发及任务调度(上)
136 0
|
6月前
|
SQL 分布式计算 DataWorks
带你读《企业级云原生白皮书项目实战》——5.2.6 数据开发及任务调度(下)
带你读《企业级云原生白皮书项目实战》——5.2.6 数据开发及任务调度(下)
134 0
|
7月前
|
大数据
阿里云产品体系分为6大分类——大数据——大数据的5种模块——数据开发
阿里云产品体系分为6大分类——大数据——大数据的5种模块——数据开发自制脑图
114 1
|
11月前
|
SQL 分布式计算 资源调度
阿里云-DataWorks- ODPS SQL开发4-SQL性能优化
阿里云-DataWorks- ODPS SQL开发4-SQL性能优化
|
11月前
|
SQL 分布式计算 Unix
阿里云-DataWorks- ODPS SQL开发3-日期与字符、数学运算、聚合函数函数
阿里云-DataWorks- ODPS SQL开发3 本文主要讲解日常大量会接触到的一些常用的日期与字符、数学运算、聚合函数函数。
|
11月前
|
SQL 分布式计算 DataWorks
阿里云-DataWorks- ODPS SQL开发2
阿里云-DataWorks- ODPS SQL开发2 本文主要讲解日常大量会接触到的一些常用函数与关键词
推荐文章
更多