开发者学习笔记【阿里云云数据库助理工程师(ACA)认证:云原生多模数据库 Lindorm(一)】
课程地址:https://edu.aliyun.com/course/3112080/lesson/19081
云原生多模数据库 Lindorm(一)
课程目标
学习完本课程后,你将能够:
1.阿里云原生多模数据库Lindorm产品市场定位
2.目标客户、应用场景、商业价值及生态策略
内容介绍
一、什么是阿里云原生多模数据库 Lindorm
二、产品目标客户、应用场景及商业价值
三、生态策略
一、什么是阿里云原生多模数据库 Lindorm
云原生多模数据库Lindorm适用于任何规模、多种引擎的云原生数据库服务,支持海量数据的低成本存储处理和弹性按需付费,兼容HBase、Solr、SQL、OpenTSDB 等多种开源标准接口,是互联网、IoT、车联网、广告、社交、监控、游戏、风控等场景首选数据库。
产品特点:
极致性价比
云原生弹性
企业级稳定性
数据生态融合
目标行业:
每秒千万级合吐工业物联网
车联网
APM运维
NPM运维
云原生多模数据库Lindorm,是面向未来物联网,车联网等等拥有大量持续数据的场景而特别设定的一款数据库。未来不管是物联网还是车联网,他的数据采集和特点主要以:
1. 每种数据都有一种时间戳来标记当前所采集的时间点;
2. 数据格式会呈现多模态的形态,比如,要采集汽车的数据,用持续指标的数据和日志数据,还有网络上一些网络包的数据,还有用户点击的链码线路的数据,这些数据需要有不同的数据库,引擎来处理,来存储融合的去分析。云原生多模数据库Lindorm 是一种具有多数据引擎的书数据库产品,不但能够支持持续指标,持续文本等数据的存储,还能够提供海量的低成本的能力。所有的容量规划可以提供 Solr 的方式和弹性按需付费的方式提供客户,客户可以根据业务的增长情况,动态地去扩容配置。同时未来不管是大数据系统还是数据应用系统都需要用到很多生态的产品。兼容HBase、Solr、SQL、OpenTSDB 等多种开源标准接口,可以很灵活的,很敏捷地植入到现在的大数据体系,或者大数据应用之中。互联网、IoT、车联网、广告、社交、监控、游戏、风控等场景首选数据库。
特点:1、极致的性价比,它可以提供比其他数据库更高的性价比,来存储海量低价平民数据库的持续监控数据。
2、云原生弹性,比如要为车联网下,所有车辆的数据采集提供服务,就需要公用云端,公有云和专有云协同,去采集、存储、分析这些数据,可以提供云端的,云服务的无缝对接的能力。
3、3、企业级的稳定性:提供数据可靠性保障,在云端可以做到不丢数据,把所有的数据存储起来,支撑上层的应用,查询存储分析和定位。
4、数据生态的融合各种现在主流的大数据生态和数据存储等等数据接口都可以兼容,把以往原存储方案用多种引擎自建的合二为一,一体化的超融合的提供给上层。应用可以通过统一接口来接入已知的数据的访问接口来去查多模的数据,大大简化了数据库的架构。
主要面向行业有工业互联网、车联网以及 APM运维、NPM 运维这些场景都是需要采集海量的持续数据,同时这些数据呈现多种模型,需要多模数据库来存储这种场景。
阿里云 Lindorm 数据库演进历史
分布式、高扩展
2011.3
基于HBase研发的lindorm-1.0在淘宝上线
2012.3
数据规模达到100TB,秒请求10万
多租户、高可用、企业级
2013.5
大集群功能上线,开启多租户服务,可以通过多租户的方式提高能力
2014.1
SQL功能上线,兼容Phoenix 查询宽表的数据,能够在企业级高可用环境下提供存储。
2015.11
高可用架构落地,峰值秒请求超5000万
2016.11
线上规模超1万台,作为 中台服务高德、优酷、文娱等全经济体
低成本、商业化
2018.7
Lindorm-2.0发布,引擎大幅升级优化,实现7倍HBase性能,10倍压缩比,冷热分离
2019.8
作为云HBase增强版进行商业化,在数据访问、索引、容灾等方面发布多项独家功能
云原生、多引擎
2020.3
Serverless能力发布,按需付费,即时弹性,动态地去扩容缩容数据库存储能力,可以大幅地降低使用成本,真正做到了云原生。
2020.9
Lindorm全新升级,同时支持宽表、时序、搜索、文件四种引擎,发布超低成本的容量型存储
Lindorm 数据库架构
从体系结构看,内部建成了宽表持续索引文件等等多种的数据引擎存储,来引发对未来的复杂场景下的海量异构数据的存储和索引问题。能够在存储层的上层去架设引擎,帮助我们去把数据对接到不同的数据生态之上。
技术架构底层 Lindorm 开发等,云原生的存储引擎支持多种模式的数据存储。在其上是面对不同类型的数据架设的数据存储引擎,每种引擎支持不同的数据。在上层还可以提供高级的数据计算引擎,支撑我们现在的智能工业,智能生活,智能城市等一些场景下的智能化的数据应用,性价比是同类数据库里边最高的。多引擎的多模能力融合也是首个做到在工业持续场景下做到多引擎融合协同配合存储。同时云原生能力是国内首个提出云原生多模能力的云端数据库。企业级的存储能力P99的时延<5ms。端边云一体化,工业物联网,物联网场景下,边缘端、云端协同配合来做持续数据采集存储的场景。
Lindorm 优势能力
1. 为了实现高性价比的存储,可以达到10:1的实时无损,高压缩比存储,深度优化 ZSTD 压缩的算法,大幅提升现有算法的压缩比。
场景:
数据按时间线写入,近线访问为主
价值:
冷数据存储成本减少80%,热数据访问性能提升15%
优势:
即开即用,按表开启
应用零改造
冷热分隔线,灵活调整
自由设置冷热的存储介质、压缩算法
2. 面向实时采集的海量低价值密度的持续指标,持续文本数据,来做这种自动化的冷热分离,低成本存储方案。Lindorm 的一体化冷热分离,能实现数据的自动分层,这样就不用人工干预数据的分离,可以自动地帮我们去压缩数据存储的一个成本。底层性能型存储、标准型存储、容量型存储就会自动地去做调配,去应对不同场景下的数据存储和需要。
使用场景:
1.集群搬迁
2.主备容灾
3.业务拆分
优势:
1.支持跨版本、异构
2.源端无影响,自身易迭代
3.业务透明
4.高吞吐(物理拷贝+分布式),单节点100MB/S
5.在线、可容错、可监控、正确性、自助易用
批量/实施数据迁移同步
在 Lindorm 内部安置了一个 LTS 的数据同步引擎,可以做到多种引擎之间的数据实时批量的同步,同时也可以对 HBase 等第三方数据语言,帮助我们把数据迁移到 Lindorm 之上,或者将 Lindorm 的数据传递到第三方的生态存储平台上,做到数据的互联互通。
多模数据融合检索打通,IT & OT数据交互
实现跨多引擎引擎查询,提供全维检索能力,来实现在同一场景下,要查询时序数据,宽表数据,或者是全文检索数据等等场景的协同工作。这样就可以把异构的多模数据融合唱一个数据,返回给客户。
统一API,简单易用
1. 系统自动维护索引,应用开发不感知索引表
2. 索引支持非冗余、冗余部分列、全冗余
3. 查询时基于编译优化(RBO)自动路由到搜索引擎,并智能判断是否需要回查宽表/时序引擎
数据自动同步到搜索引擎
1.异步增量索引,基于LTS提供可扩展的同步通道,数据同步可视化
2.实时同步索引,引擎间数据强一致
云边端一体化存储,数据自动实时、批量同步
·边缘版轻量级快速集成部署
·具备与云端版本一样的功能
·2HA高可用架构
·数据自动同步至阿里云TSDB实例集群
云边端的一体化存储方案是基于边缘端的数据库和服务端的数据库来协同工作,来实现从边缘端采集指标数据,批量实施同步到云端,来实现集中的存储,和边缘端的实时采集协同工作。这样做的好处就是我们可以免去开发语言,可以自己开发边缘端数据采集,和云端的全量数据存储采集的复杂度,边缘端可以实时采集,以及边缘端的实时数据的检索、可视化、告警,而云端可以把边缘段的数据同步到云端集中存储数据的集中分析、回溯、故障定位、虚实预测,利用云端强大的计算能力来深度加固全量的采集到的指标和数据,来解决不同场景的数据的需要。
Lindorm + Intel + OSIsoft IT & OT超融合工业数据云方案
方案价值:
1.资产链路风险集中监控,提升成本效益
2.设备预防性维护,降低突发故障带来的损失
3.IT&OT多源数据接入,云端业务导向异构数据融合,也能让我们看到整个生产环境的前景,实施的探查一些异常情况,做主动的干预
4.全景资产风险管理,降低资本支出
这个方案联合了Inter、OSIsoft IT 和 OT超融合工业数据能力,将凹体数据的参准能力和 Lindorm 的 IT 数据的存储能力完美的融合,形成超融合数据工业云方案,不管是离散工业还是流程工业与要做集中的数据的存储,还是边缘端做实时的采集和告警都能完美地去兼容。