东方金信专注大数据平台开发 构建智慧城市大脑

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

从2015年的“大数据行动纲要”到2016年的“十三五规划”,大数据都被作为重点被提及。尤其是2016年,政府提出各个省市三年之内必须上大数据业务,导致各省市政府全部都在部署与大数据相关的业务。这快速地推动了政府行业在大数据方面业务地发展。

“大数据平台其实是智慧城市大脑,政府更需要大数据,比如数据打通后,进京证可以通过手机来办理。此外,还有医挂号等事务的办理。这些都需要我们的大数据平台。”东方金信CEO王伟哲介绍道。

深挖政务领域需求

王伟哲表示:“政府部门对于政务大数据平台的需求非常强烈。我们在政府里面做的第一件事情就是建立人口库。输入姓名,你能看到该公民家族图谱,一生从出生到上学,再到结婚买房等等变化曲线。并且,你可以了解这些人有什么样不动产和动产,甚至个人、企业之间是否的关联和担保关系,都可以通过一张相似的图谱来显示。此外,在医院数据导入进来以后,医务人员可以通过此类图谱了解到病患的家族遗传病史,对病患进行相应地救治。”

据了解,从2013年成立至今,东方金信业务覆盖的行业越来越广泛。在行业比例上,金融行业客户大概占东方金信的40%左右,政府占40%左右,其他的行业大概加起来占20%左右。

王伟哲表示:“如果从一个城市对整个的大数据的投入上来说,我们的这些软件和这些数据业务占政府应用系统的比例仍然比较低,大概十分之一左右。一个城市如果充分应用大数据,一个城市的投入大概应该是在三亿元到五亿元之间。我们的软件,就是帮政府管理者整合数据,并且将报告进行前端展示。这些需要的资金大概占政府总体大数据投放的比例的10%左右,其余基本上都是硬件建设。”

建立标准打通孤岛

当下,很多数据的格式标准都不尽相同。此外,各部门之间也会由于业务不同、利益不同等诸多原因导致很多数据被束之高阁,无法有效利用。比如,在一个银行里,可能会存在几十甚至上百个不同的业务。那么如何将这些数据进行定义,形成统一的标准,使数据更方便地导入导出,进而进行分析、挖掘。

王伟哲认为:“在一些业务比较多的单位里,可能会存在几百套系统单元,数据要对接到这么多的数据平台里,非常费力。东方金信曾经为一些客户,设定了两千九百多个数据标准。”而这些标准是需要和客户进行长期沟通,共同建立的。王伟哲补充道:“我们要和业务部门去确认业务场景,以及业务数据是什么。其实数据标准其实有很多种,一种是按数据存储长度,比如身份证是十八位。而有些身份证里边有字母,这也是一种标准。身份证代表一个人的个性属性,是我的唯一标识,就是业务属性,它就是一种标准。所以,这种标准非常多。”

为此,东方金信建立了专门系统来完善制定数据标准的流程。这个系统就是按照方法论来运作的,东方金信有一套标准的流程来定义这些数据标准,数据标准的审批流程和通过流程都通过该系统来顺利完成。

“师”从谷歌专修技术

作为一家专注于大数据平台和大数据解决方案的企业,东方金信从事的就是把数据业务放在自主研发的分布式架构平台上。

分布式架构其实是由谷歌提出,谷歌有上百万台服务器。这些服务器没有采用IBM、Oracle、EMC这些知名厂商的数据库和存储设备来解决问题,而是采用了的分布式架构来解决数据问题。东方金信的核心产品脱胎于Google分布式大数据平台,专注于企业级高性能分布式大数据解决方案和云解决方案。

东方金信是一家纯技术类的公司,王伟哲介绍说,从人员比例看,公司总人数里,销售、市场、财务和人力人员总共不超过10%,其他全部从事技术研发和产品客户化研究。东方金信核心团队来自Google、美国银行、Teradata、IBM、阿里、腾讯等全球著名企业的核心数据开发人员,具有丰富的分布式研发能力和数据分析挖掘能力。

目前,东方金信的研发团队可以独立编译底层代码,优化大数据平台,并和中国科学院大学合作成立大数据研发中心,和北京交通大学合作成立铁路大数据研究中心。

王伟哲表示,公司在未来最大的愿景是“希望我们的产品能做得更好,SeaBox大数据平台整体解决方案能为更多的行业用户提供帮助,为客户带来更多的价值,将来会有更多的客户使用SeaBox大数据平台。”






原文发布时间为:2017年2月21日
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
1月前
|
传感器 人工智能 大数据
高科技生命体征探测器、情绪感受器以及传感器背后的大数据平台在健康监测、生命体征检测领域的设想与系统构建
本系统由健康传感器、大数据云平台和脑机接口设备组成。传感器内置生命体征感应器、全球无线定位、人脸识别摄像头等,搜集超出现有科学认知的生命体征信息。云平台整合大数据、云计算与AI,处理并传输数据至接收者大脑芯片,实现实时健康监测。脑机接口设备通过先进通讯技术,实现对健康信息的实时感知与反馈,确保身份验证与数据安全。
|
1月前
|
数据采集 机器学习/深度学习 DataWorks
DataWorks产品评测:大数据开发治理的深度体验
DataWorks产品评测:大数据开发治理的深度体验
116 1
|
1月前
|
分布式计算 Shell MaxCompute
odps测试表及大量数据构建测试
odps测试表及大量数据构建测试
|
2月前
|
人工智能 分布式计算 数据处理
MaxCompute Data + AI:构建 Data + AI 的一体化数智融合
本次分享将分为四个部分讲解:第一部分探讨AI时代数据开发范式的演变,特别是MaxCompute自研大数据平台在客户工作负载和任务类型变化下的影响。第二部分介绍MaxCompute在资源大数据平台上构建的Data + AI核心能力,提供一站式开发体验和流程。第三部分展示MaxCompute Data + AI的一站式开发体验,涵盖多模态数据管理、交互式开发环境及模型训练与部署。第四部分分享成功落地的客户案例及其收益,包括互联网公司和大模型训练客户的实践,展示了MaxFrame带来的显著性能提升和开发效率改进。
|
3月前
|
人工智能 监控 物联网
数字孪生与智慧城市:构建未来城市模型
在信息化和智能化时代,数字孪生技术融合大数据、云计算、物联网和AI,成为推动智慧城市建设的关键力量。本文探讨其在城市规划、管理、交通、环保及公共服务中的应用,展现其如何优化城市运行,助力构建未来的理想城市模型。
|
3月前
|
监控 安全 自动驾驶
|
3月前
|
传感器 监控 安全
创新无限:物联网技术在智慧城市构建中的前沿探索
【10月更文挑战第29天】在这个信息爆炸的时代,物联网(IoT)技术正重塑我们对城市的认知。智慧城市已从科幻走向现实,物联网通过连接各种设备和传感器,收集、分析数据,提升城市运行效率和居民生活质量。从智慧城管、智能交通、智慧水务到智能电网,物联网的应用正逐步实现城市的智能化、互联化和可持续发展。
135 1
|
3月前
|
传感器 数据采集 人工智能
数字孪生与智慧城市:构建未来城市模型
【10月更文挑战第31天】在信息化和智能化高速发展的今天,数字孪生技术正逐步成为推动智慧城市建设的核心力量。本文将深入探讨数字孪生技术在城市规划、管理、交通和环保等方面的应用,以及它如何助力构建未来城市的理想模型。数字孪生通过实时数据同步和双向交互,实现城市运行状态的全面监控、预测和优化,推动城市向更加智慧、绿色和可持续的方向发展。
|
3月前
|
安全 搜索推荐 大数据
大数据与智慧城市:数据驱动的城市管理
【10月更文挑战第31天】在信息技术飞速发展的今天,大数据成为推动智慧城市转型的核心驱动力。本文探讨了大数据在智慧交通、环保、安防、医疗和政务等领域的应用,揭示了数据驱动的城市管理带来的深刻变革,同时分析了面临的数据安全、隐私保护和数据孤岛等挑战,并展望了大数据在智慧城市建设中的未来前景。
|
4月前
|
消息中间件 分布式计算 大数据
大数据-166 Apache Kylin Cube 流式构建 整体流程详细记录
大数据-166 Apache Kylin Cube 流式构建 整体流程详细记录
119 5