是什么让TA蹲5个小时也要听完?--深圳云栖大会数据库技术专场8大爆点-阿里云开发者社区

开发者社区> 阿里云数据库> 正文
登录阅读全文

是什么让TA蹲5个小时也要听完?--深圳云栖大会数据库技术专场8大爆点

简介: 这是一场数据库技术网(干)红(货)见面会。云栖大会深圳峰会,阿里云数据库团队发出大招——PB级数据存储:PetaData数据库发布、SAP HANA One数据库的合作和云数据库OceanBase发布,还有褚霸、何导、丁奇、叶翔、玄惭的深度分享。

        4月21日下午在深圳大中华喜来登召开的云栖大会-Tech Insight-数据库技术专场在开始前半小时,全部位置已坐满以至于在正式开始前就地上坐满了人,过道站满了人,不得不派出安保维持现场秩序。

b4737cd8beb48557ebbea6373f06bf49e6980508


       是什么让技术人员如此热情高涨?没错,就是数据库技术网(干)红(货)见面会。开会前,某技术网红(此处特指褚霸)说要放大招今天,我可以告诉你,大招是PB级数据存储:PetaData数据库发布、SAP HANA One数据库的合作和云数据库OceanBase发布。当然,还有更大招,将在7月云栖大会北京峰会对外公开,现在就可以期待了。

        前方高能大招,各位准备好了吗?请擦亮眼睛观看本场内容的8大观点:


一、褚霸:我们正在见证数据库的变迁       

4933c0bda3774ac67de1c64777f5a4b1534af520

        数据库从上个世纪70年代开始,经过50年的发展,当前已有300多种数据库系统。

        1数据库焦点在转移近看这10年的发展,为了更好的支撑互联网应用构建和迭代,架构师们更愿意选择轻量级数据库,特别是MySQL,所以我们看到数据库的焦点正在从商业库向开源数据库倾斜。

        2处理能力在发展:而从技术角度来看,一方面是从单机数据库分布式快速发展,另一方面数据库正在从单一的事务处理或者计算处理,向混合型处理发展,我们称之为HTAP(Hybrid Transaction/Analytical Processing) 。

        3使用模式在转变:从数据库获得途径来看,正在从传统软件+硬件走向云平台(服务)的新模式



二、何导:DT时代,“数据”是必须重视的核心资产

        企业经营多年,最后积累的永久宝贵资产除了钱就是数据

        根据不完全统计调查显示,当前创业公司中拥有数据库管理员(DBA)的企业小于4%(专业的DBA人才都集中在几个大型企业中),而这4%中还有一半以上是由运维人员兼职的。这在提醒我们:企业的最宝贵资产  —“数据”没有人保管!?

        ApsaraDB 团队致力于将数据库门槛降到0点,一键为用户创建一套完整而专业的数据库解决方案,包括高可用、高密度监控、备份和恢复、自动优化等。让开发可以轻松、专业的管理数据库。

       而面向日夜忙碌的DBA,我们不但可以帮助他们减少60%的日常工作,而且可以让他们以“数据管理员DataA”的视角,以“企业数据”为中心,全方向重新审视安全性、可靠性、可扩展性、远距离容灾等数据盲点,以全新的职能全力协助企业快速发展。

b839b0cb055762b625c4a0ca6b7068e2c665357c



三、丁奇:数据库宕了,到底是谁的原因?

        数据库宕了大家着急,但很难使上力。于是各种猜测、指责开始蔓延…究其原因就是无法判断问题出在哪里,如何快速恢复。而今天,ApsaraDB 一直致力于建设高可诊断性的数据库。通过全链路监控,能够快速判断链路问题出在哪个节点。

        通过保存所有审计日志,在用户事后发现时, 授权后能够分析导致所有异常的原因。审计日志中可以保存每个语句的原文、来源ip、端口、微秒级执行时间、微秒级开始时间、扫描行数、返回行数、执行结果等,典型应用场景如:

        1)当用户发现数据被删除时,可以查出执行删除语句的所有信息方便定位;

        2)当用户出现大量锁等待时,可以分析出问题当时所有线程的事务状态,从中分析锁等待关系链;

        3)当用户出现大量读io时,可以分析当时所有语句的扫描行数轻松判断;

        从链路、主机、实例级别保存所有信息,使得数据库实例随时处于可诊断状态。

 

 

四、丁奇:比社区版本快100倍。真的吗?

        ApsaraDB即将上线的GreenPlum服务,要比社区快100倍?

        首先解释下这个100倍是指分区表插入速度快100倍。其原理:分区表插入关键是判断一个插入值属于哪个分区。社区版是采用触发器实现:

       1)需要调用触发器的逻辑,代码链路很长,导致执行慢。

       2)需要使用遍历的方式来判定一个值所属分区,非常低效。在分区较多(比如几百个分区)时,会很慢。分区越多,速度越慢。

 

        而 ApsaraDB for GreenPlum的方法 :

        1)无需调用复杂的触发器逻辑 

        2)采用二分法遍历分区的临界值,算法由O(N)降至O(logN)

 

 

五、叶翔:传说会丢数据的数据库,为什么会成为新的趋势?

        一个丢数据的数据库是不可能如此流行,“传说”更准确的说是“谣言”。

        MongoDB是非常灵活和可靠的数据库,用户可以自行配置写入可靠性级别,所以往往是误用了低可靠性参数而造成了一定概率的丢失。MongoDB的文档型数据结构与面向对象编程有天然的兼容性,数据建模非常容易上手。并且其支持高可用的复制集,灵活的分区功能等,这些核心功能促进了MongoDB的崛起。MongoDB在互联网对NoSQL的需求浪潮下,没有不火的道理。

        阿里云也是趁胜追击推出了MongoDB云服务。提供了更高的可靠性,背后还具有非常专业的MongoDB源码团队支撑。也欢迎大家前来使用,与阿里云一起享受NoSQL红利。

 


六、叶翔:NoSQL数据库如何选型?

        一般来说,NoSQL数据库选型需要从数据模型存储特性两方面综合考虑,拿最流行的三个NoSQL数据来举例:

        1)数据模型:

        2)存储特性上:

  • 持久化需求高数据量大,作为核心数据源,或者有轻度计算需求的:MongoDB
  • 对性能要求极致,不担心数据丢失的选择:Memcache
  • 数据生命周期短,数据量相对小,性能要求高:Redis

 

 

七、叶翔:NewSQL又是什么鬼?

        简单的来说:SQL+NoSQL=NewSQL。 NewSQL被定义为下一代数据库的发展方向。甚至在今天的数据库特性上已经可以看到这个趋势:最流行的开源关系型数据库:MySQL ,从5.7版本开始具有JSON,KV解决方案;而最流行的NoSQL数据库:MongoDB,也推出Join解决方案。

        SQL与NoSQL的界限逐渐在模糊,甚至传统关系型数据库PostgreSQL可以利用FDW让MongoDB作为其数据源。所以,不论SQL也好,NoSQL也好,都会以NewSQL的形态展现。

 

 

八、玄惭:《云数据库十大经典案例》满满全是干货,直接放PPT可以吗?

        《云数据库十大经典案例》以MySQL数据库为例,收集整理了自阿里云数据库团队至今,用户在使用RDS过程中最常见的问题。包括:

1)索引

2)sql优化

3)锁

4)延迟

5)参数优化

6)连接数

7)cpu

8)iops

9)磁盘

10)内存

        每个案例的背后都是活生生的生产故障,希望通过这些案例的总结还原问题原貌,给出分析问题的思路。也许有一天,当你遇到类似问题的时候能够触类旁通,举一反三,快速解决问题。

        最佳实践收集了阿里云多年在数据库上的开发经验和内核团队在MySQL上的优化实践,以及众多专家在处理各类问题后积累下来的最佳实践,希望用户能够在使用云数据库的路上少一些弯路,多一些从容。

cad6d8396375f2a28e52f9e0dc694d534b0031ab



整场内容PPT观看,请移步>>

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
阿里云数据库
使用钉钉扫一扫加入圈子
+ 订阅

帮用户承担一切数据库风险,给您何止是安心!

官方博客
链接