大数据时代,企业的数据积累就相当于财富积累。但是在当下这个数据容量呈几何倍暴增的时代背景下,数据的价值在其产生之后,将随着时间的流逝,逐渐降低。
因此,对于企业而言,迅速的对实时数据进行有效处理相较于数据存储在一起之后再进行批量处理,数据价值孰高孰低不言而喻。
近日,阿里云实时计算宣布正式推出独享模式,开放udx,支持更多如fpga,gpu等机型,方便vpc的打通,极大拓展流计算的适用范围。
一、依托于独特的产品架构,阿里云流计算提供一些极具竞争力的产品优势:
强大的实时处理能力
阿里云实时计算集成诸多全链路功能,方便用户进行全链路流计算开发,包括:强大的实时计算引擎,提供BlinkSQL,支持各类Fail场景的自动恢复,保证故障情况下数据处理的准确性;支持多种内建的字符串处理、时间、统计等类型函数;精确的计算资源控制,彻底保证公共云用户作业的隔离性。
关键性能指标超越开源Flink的3到4倍,数据计算延迟优化到秒级乃至亚秒级,单个作业吞吐量可做到百万(记录/秒)级别,单集群规模在数千台。
深度整合各类云数据存储,包括DataHub、日志服务(SLS)、RDS、OTS、ADS、IOTHub等各类数据存储系统,无需额外的数据集成工作,阿里云实时计算可以直接读写上述产品数据。
托管的实时计算服务
不同于开源或者自建的流式处理服务,阿里云实时计算是完全托管的实时计算引擎,可针对流数据运行查询,无需预置或管理任何基础设施,一键启用流式数据服务能力。并且天然集成数据开发、数据运维、监控预警等服务,方便用户最小成本试用和迁移实时计算。
良好的流式开发体验
支持标准SQL(产品名称为:BlinkSQL),提供内建的字符串处理、时间、统计等各类计算函数,替换业界低效且复杂的Flink开发,让更多的BI人员、运营人员通过简单的BlinkSQL可以完成实时化大数据分析和处理,让实时大数据处理普适化、平民化。 提供全流程的流式数据处理方案,针对全链路实时计算提供包括数据开发、数据运维、监控预警等不同阶段辅助套件,让数据开发仅需三步,即可完成流式计算作业上线。
降低人力和集群成本
大量优化的SQL执行引擎,会产生比手写原生Flink作业更高效且更廉价的计算作业,无论开发成本和运行成本,阿里云实时计算均要远低于开源流式框架。
二、应用场景
实时计算使用BlinkSQL主打流式数据分析场景,目前在以下领域有使用场景:
实时ETL 集成实时计算现有的诸多数据通道和SQL灵活的加工能力,对流式数据进行实时清洗、归并、结构化。作为离线数仓有效的补充和优化,作为数据实时传输的可计算通道。
实时报表 实时化采集、加工流式数据存储,实时监控和展现业务、客户各类指标,让数据化运营实时化。
监控预警 对系统和用户行为进行实时检测和分析,实时监测和发现危险行为。
在线系统 实时计算各类数据指标,并利用实时结果及时调整在线系统相关策略。在各类内容投放、无线智能推送领域有大量场景。
阿里云实时计算脱胎于阿里集团内部双十一实时大屏业务,在阿里集团内部从最开始支持双十一大屏展现和部分实时报表业务的实时数据业务团队,历经4、5年的长期摸索和发展,到最终成长一个独立稳定的云计算产品团队。阿里云实时计算期望将阿里集团本身沉淀多年的流计算产品、架构、业务能够以云产品的方式对外提供服务,助力更多中小企业实时化自身大数据业务。
戳此链接1元试用阿里云实时计算:
https://data.aliyun.com/product/sc