揭秘!阿里巴巴"大数据动态屏"系统

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

北大CIO开源兴趣小组讨论总结:杭州之行,看阿里,华三繁华,西子的妖媚,留下了脚印,也丰满了见识,结下同学师生友谊。

当然我们终归要回归的我们企业自身,哪些东西我们CIO可以借鉴,哪些东西我们可以去尝试?

其中最吸引大家眼球的应该算 "大数据屏"了吧,是否考虑在企业中也构建一个类似系统?

让我们行动行动,看看"大数据动态屏 (Dynamic Bigdata Large Screen) DBLS" 背后的BigData数据可视化技术。

如何在企业中构建阿里巴巴动态屏幕?

数据大屏的对外价值和对内价值: 员工激励,领导视察,友商考察。

系统架构:

硬件部分:

从网络上调查得到消息: 实时数据显示的大屏幕拼接墙是由宁波GQY视讯股份有限公司提供。网站地址: http://www.gqy.com.cn/index.asp

前段软件:

阿里巴巴数据大屏使用的是基于Flex构建的动态图标,其中涉及需要相关软件定制开发工作。

技术分类: Flash,Html5,原生代码


==基于Html5/JavaScript的工具包==

开源软件包: 百度-Echarts http://echarts.baidu.com/doc/example.html

其他Html5补充: http://www.highcharts.com/


==基于Flash的工具包: flex builder ==

商业软件包:fusioncharts http://www.fusioncharts.com/

开源软件包:open-flash-chart http://teethgrinder.co.uk/open-flash-chart/

其他补充:http://www.anychart.com/home/


后端软件: 系统基于Hadoop,Storm,Spark等后台大数据技术。

技术提供商: 比如 红象公司 www.redhadoop.com 美国: Hortonworks Cloudera mapR 三家。

后端数据: 数据由alibaba后台数据系统抽样得到。获取方法 alibaba taobao api , Weibo Api 等。

其他问题

==国内外那些公司开发有开源软件,如何使用? ==

国外:

www.sf.net 最古老的开源软件聚集托管地。

www.github.com 使用社交思路构建的代码托管基地,现在最火爆。

www.apache.org 大数据开源软件多来源于此。


国内:

http://www.oschina.net/ 开源中国社区

http://code.csdn.net CSDN社区

http://code.taobao.org/ 淘宝开源

企业使用开源需要一定的开发背景,使用前最好有开发能力基础。


企业那些场合需要利用Hadoop软件,对于企业技术实力有那些要求和项目投资?

当企业遇到TB级别数据需要快速处理,深度数据挖掘和分析多需要使用Hadoop了。需要一定研发基础。项目投入主要是开发和硬件投入。可以考虑使用阿里云降低前期硬件投入。


Hadoop软件和传统数据仓库分析和挖掘的区别?

核心理念是移动数据多,还是移动计算多。具体看大家数据规模。数据规模大的(TB级别),每天大量新增的。


企业是否需要构建私有云?

不管黑猫,白猫抓到老鼠就是好猫。同样不管私有云和公用云。关键还是能解决企业核心IT问题。(成本,质量,时间,安全等)

基于企业自身业务对于 带宽,硬盘,安全【Xen,Vmware,OpenStack】,还是需要混合云,如果是互联网应用,对于硬盘资源需求不大也可以考虑公有云。学校由于,利用率,场地,教学,环境复杂,保护卡等问题。考虑建设私有云居多。


原文发布时间为:2014-05-03


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
1月前
|
数据采集 SQL 搜索推荐
大数据之路:阿里巴巴大数据实践——OneData数据中台体系
OneData是阿里巴巴内部实现数据整合与管理的方法体系与工具,旨在解决指标混乱、数据孤岛等问题。通过规范定义、模型设计与工具平台三层架构,实现数据标准化与高效开发,提升数据质量与应用效率。
大数据之路:阿里巴巴大数据实践——OneData数据中台体系
|
2月前
|
分布式计算 监控 大数据
大数据之路:阿里巴巴大数据实践——离线数据开发
该平台提供一站式大数据开发与治理服务,涵盖数据存储计算、任务调度、质量监控及安全管控。基于MaxCompute实现海量数据处理,结合D2与DataWorks进行任务开发与运维,通过SQLSCAN与DQC保障代码质量与数据准确性。任务调度系统支持定时、周期、手动运行等多种模式,确保高效稳定的数据生产流程。
大数据之路:阿里巴巴大数据实践——离线数据开发
|
2月前
|
数据采集 存储 大数据
大数据之路:阿里巴巴大数据实践——日志采集与数据同步
本资料全面介绍大数据处理技术架构,涵盖数据采集、同步、计算与服务全流程。内容包括Web/App端日志采集方案、数据同步工具DataX与TimeTunnel、离线与实时数仓架构、OneData方法论及元数据管理等核心内容,适用于构建企业级数据平台体系。
|
1月前
|
存储 SQL 分布式计算
大数据之路:阿里巴巴大数据实践——元数据与计算管理
本内容系统讲解了大数据体系中的元数据管理与计算优化。元数据部分涵盖技术、业务与管理元数据的分类及平台工具,并介绍血缘捕获、智能推荐与冷热分级等技术创新。元数据应用于数据标签、门户管理与建模分析。计算管理方面,深入探讨资源调度失衡、数据倾斜、小文件及长尾任务等问题,提出HBO与CBO优化策略及任务治理方案,全面提升资源利用率与任务执行效率。
|
2月前
|
机器学习/深度学习 存储 分布式计算
ODPS驱动电商仓储革命:动态需求预测系统的落地实践
本方案基于ODPS构建“预测-仿真-决策”闭环系统,解决传统仓储中滞销积压与爆款缺货问题。通过动态特征工程、时空融合模型与库存仿真引擎,实现库存周转天数下降42%,缺货率下降65%,年损减少5000万以上,显著提升运营效率与GMV。
162 1
|
1月前
|
存储 监控 大数据
大数据之路:阿里巴巴大数据实践——事实表设计
事实表是数据仓库核心,用于记录可度量的业务事件,支持高性能查询与低成本存储。主要包含事务事实表(记录原子事件)、周期快照表(捕获状态)和累积快照表(追踪流程)。设计需遵循粒度统一、事实可加性、一致性等原则,提升扩展性与分析效率。
|
存储 分布式计算 大数据
大数据之路:阿里巴巴大数据实践——大数据领域建模综述
数据建模解决数据冗余、资源浪费、一致性缺失及开发低效等核心问题,通过分层设计提升性能10~100倍,优化存储与计算成本,保障数据质量并提升开发效率。相比关系数据库,数据仓库采用维度建模与列式存储,支持高效分析。阿里巴巴采用Kimball模型与分层架构,实现OLAP场景下的高性能计算与实时离线一体化。
|
2月前
|
SQL 缓存 监控
大数据之路:阿里巴巴大数据实践——实时技术与数据服务
实时技术通过流式架构实现数据的实时采集、处理与存储,支持高并发、低延迟的数据服务。架构涵盖数据分层、多流关联,结合Flink、Kafka等技术实现高效流计算。数据服务提供统一接口,支持SQL查询、数据推送与定时任务,保障数据实时性与可靠性。
|
7月前
|
传感器 监控 大数据
指挥学校大数据系统解决方案
本系统集成九大核心平台,包括中心化指挥、数据处理、学生信息、反校园欺凌大数据、智慧课堂、学生行为综合、数据交换及其他外部系统云平台。通过这些平台,系统实现对学生行为、课堂表现、校园安全等多维度的实时监控与数据分析,为教育管理、执法机关、心理辅导等提供强有力的数据支持。特别地,反校园欺凌平台利用多种传感器和智能设备,确保及时发现并处理校园霸凌事件,保障学生权益。同时,系统还涵盖超市、食堂、图书馆、消防安全等辅助云平台,全面提升校园智能化管理水平。
|
8月前
|
传感器 人工智能 大数据
高科技生命体征探测器、情绪感受器以及传感器背后的大数据平台在健康监测、生命体征检测领域的设想与系统构建
本系统由健康传感器、大数据云平台和脑机接口设备组成。传感器内置生命体征感应器、全球无线定位、人脸识别摄像头等,搜集超出现有科学认知的生命体征信息。云平台整合大数据、云计算与AI,处理并传输数据至接收者大脑芯片,实现实时健康监测。脑机接口设备通过先进通讯技术,实现对健康信息的实时感知与反馈,确保身份验证与数据安全。

热门文章

最新文章