大数据分析的下一代架构--IOTA架构设计实践
IOTA的特点:
[x] 去“ETL”化
[x] 高效:时时入库即时分析
[x] 稳定:经过易观5.8Pb,5.2亿月活数据锤炼
[x] 便捷:支持SQL级别的二次开发和UDAF定义
[x] 扩充性强:组件基于Apache开源协议,可支持众多开源存储对接
MongoShake——基于MongoDB的跨数据中心的数据复制平台
MongoShake是基于MongoDB的通用型平台服务,作为数据连通的桥梁,打通各个闭环节点的通道。通过MongoShake的订阅消费,可以灵活对接以适应不同场景,例如日志订阅、数据中心同步、监控审计等。其中,集群数据同步作为核心应用场景,能够灵活实现灾备和多活的业务场景。
MongoDB查询优化:从 10s 到 10ms
本文是我前同事付秋雷最近遇到到一个关于MongoDB执行计划选择的问题,非常有意思,在探索源码之后,他将整个问题搞明白并整理分享出来。付秋雷(他的博客)曾是Tair(阿里内部用得非常官方的KV存储系统)的核心开发,目前就职于蘑菇街。
PostgreSQL 百亿地理位置数据 近邻查询性能
本文主要要展示的是PostgreSQL在位置信息近邻(KNN)查询方面的性能。
测试类型point,索引类型GiST。
(PostGIS同样支持KNN查询,性能和本文的测试差不多)
测试数据量大于100亿。
阿里云赵建伟:深度定制的高性能阿里云MySQL
本文根据阿里云资深数据库工程师赵建伟在“云栖大会上海峰会”专场《“互联网+”架构及实践专场-企业级信息系统云化演进之路》中的演讲整理。赵建伟在本演讲中主要为大家分享了阿里云的数据库服务和MySQL分支的深度定制情况。
MySQL执行计划解析
前言
在实际数据库项目开发中,由于我们不知道实际查询时数据库里发生了什么,也不知道数据库是如何扫描表、如何使用索引的,因此,我们能感知到的就只有SQL语句的执行时间。尤其在数据规模比较大的场景下,如何写查询、优化查询、如何使用索引就显得很重要了。