NoSQL数据库
阿里云NoSQL数据库提供了一种灵活的数据存储方式,可以支持各种数据模型,包括文档型、图型、列型和键值型。此外,它还提供了一种分布式的数据处理方式,可以支持高可用性和容灾备份。包含Redis社区版和Tair、多模数据库 Lindorm、MongoDB 版。
带你100% 地了解 Redis 6.0 的客户端缓存
近日 Redis 6.0.0 GA 版本发布,这是 Redis 历史上最大的一次版本更新,包括了客户端缓存 (Client side caching)、ACL、Threaded I/O 和 Redis Cluster Proxy 等诸多更新。
Cassandra开山鼻祖:Cassandra是云原生和微服务化场景中最好的NoSQL数据库
前Apache Cassandra项目主席Jonathan Ellis,提出数据驱动企业变革将会是企业的新价值高地。他认为Cassandra的永续在线、无中心架构、线性扩展、全球分布等特点十分契合数据驱动的发展要求。他指出,Cassandra是云原生和微服务化场景中最好的NoSQL数据库。本文为大家解析该观点。 阿里云作为Cassandra中文社区建设者之一,率先提供Apache Cassandra公共云服务。 文末附开发者福利。
【重磅】直播预告:宽表数据库领域国际技术大牛开讲
本次非常有幸邀请到两位宽表数据库领域的国际技术大牛,给中文Cassandra社区做技术直播讲座: 1、Jonathan Ellis(Apache Cassandra开源项目最重要的技术元老、开山鼻祖之一,曾以一己之力为Cassandra开源项目贡献了近50%的代码,曾任Apache Cassandra项目主席) 2、邓为:DataStax领航架构师。 直播时间:4月27日16:00-17:30。搜索钉钉群名称『Cassandra+Spark社区大群』提前入群。 文末附开发者福利。
国际技术大咖开讲 | Apache Cassandra:引领云原生时代数据架构变革的数据库
Jonathan Ellis:数据驱动型的企业都有哪些典型的应用场景;他们对数据架构都有些什么样的需求;为什么像Apple, Facebook, Uber这样的大厂会选择Cassandra变革他们的数据架构邓为:对Apache Cassandra架构、原理、数据建模以及使用场景结合实例做深入讲解;针对Cassandra中文社区比较关心的问题,总结国外Cassandra开源社区比较流行的实用工具和学习资源讲师介绍宽表数据库领域国际技术大牛开讲Jonathan Eliis: (乔纳森·艾利斯)Apache Cassandra开源项目最重要的技术元老、开山鼻祖之一。曾任Apache Cassandra项目主席,是DataStax公司的联合创始人并一直担任技术总监,以一己之力为Cassandra开源项目贡献了近50%的代码。邓为现任DataStax领航架构师。深耕分布式数据库系统十余年,曾经参与Amazon RedShift分布式云数据仓库前身的核心技术研发。开发者福利:阿里云作为Cassandra中文社区建设者之一,贡献云上Cassandra学习资源:首购9.9元可使用三月。直达链接:https://www.aliyun.com/product/cds
Solr布尔查询的使用实践
Solr支持类似布尔语法的查询,使用AND、OR、&&、!、+、-符号,但是在使用过程中会有一些难以理解的地方,本文主要拿一个例子来介绍如何正确的使用布尔查询。
Solr Alias使用实践
本文作为Solr实践系列的一篇,主要介绍Alias别名的使用,这是Solr提供的非常重要的特性,通过几个简单的API即可享用。熟悉Alias的使用,可极大降低业务的开发复杂度。
低成本历史库最佳实践
阿里巴巴集团内为淘宝、支付宝、菜鸟提供订单、账单、物流单的历史库最佳实践方案,帮助您解决历史库的成本和扩展性问题,提供可视化的历史库链路搭建,支持水平扩展,极低的存储成本和丰富的在线查询能力。
使用Apache SuperSet和EMR Spark打造交互式的数据探索平台
本次分享主要介绍如何结合Apache SuperSet和EMR Spark,利用EMR Spark提供的JindoCube高级特性在SuperSet进行秒级响应,交互式的可视化数据探索。讲师介绍李呈祥,花名司麟,阿里云智能EMR团队高级技术专家,Apache Hive Committer, Apache Flink Committer,目前主要专注于EMR产品中开源计算引擎的优化工作。
备份!备份!备份! 看阿里云HBase的企业级备份恢复如何设计
数据安全是生命线,一线人员辛苦一年的努力可能因为一时疏忽而废,升职加薪无望;一个公司或者团队辛苦几年的打拼可能一夜回到解放前。所以面对重要的事情要说三遍:备份!备份!备份!
Redis 命令执行过程(下)
在上一篇文章中《Redis 命令执行过程(上)》中,我们首先了解 Redis 命令执行的整体流程,然后细致分析了从 Redis 启动到建立 socket 连接,再到读取 socket 数据到输入缓冲区,解析命令,执行命令等过程的原理和实现细节。
阿里HBase在用户画像领域的实践
互联网应用的一个特点是拥有海量的用户,这些海量的用户会产生海量的行为数据,有些产品还会需要去爬取更多的外部数据。基于海量数据的模型训练最终刻画出用户画像,基于用户画像自动的指导系统决策,在效率和准确度上给行业带来了质变。
Lindorm/HBase增强版技术解密|每秒7亿次请求,阿里新一代数据库如何支撑?
Lindorm,就是云操作系统飞天中面向大数据存储处理的重要组成部分。Lindorm是基于HBase研发的、面向大数据领域的分布式NoSQL数据库,集大规模、高吞吐、快速灵活、实时混合能力于一身,面向海量数据场景提供世界领先的高性能、可跨域、多一致、多模型的混合存储处理能力。目前,Lindorm已经全面服务于阿里经济体中的大数据结构化、半结构化存储场景。
HBase毛刺消除利器-双集群并发访问(Dual Service)
阿里云HBase服务了多家金融、广告、媒体类业务中的风控和推荐,持续的在高可用、低延迟、低成本方向上进行优化。为了进一步满足客户在可用性以及低延迟上的诉求,新增追求极致稳定性的双集群并发访问(Dual Service)功能.。
云数据库HBase降价优惠,最低1元包年,震撼来袭!
云数据库HBase版是面向大数据领域的一站式NoSQL服务, 支持GB至PB级数据,用于处理大规模吞吐、检索、分析工作负载, 目前正降价优惠中!
hbase全文服务(solr) 系列资料
本文整理了HBase全文服务的相关阅读材料,使用到云HBase全文服务的用户 或者 那些准备给自建HBase增加es/solr/lucene索引服务架构的用户,可以阅读以下资料了解相关原理与架构
solr常用检索查询业务demo
本文针对已经入门的同学,提供各种类型的场景查询demo,以及一些分析统计型的查询demo。这些demo基本上涵盖大部分应用企业的solr查询需求功能。
Solr快速入门文档阅读推荐——官方文档常用章节推荐
本文整理了Solr常见用法涉及的基础章节列表,通过这些章节的阅读学习,同学可以零基础快速入门使用Solr,并能够满足大部分企业的业务检索需求开发,掌握了熟悉使用Solr的基本技能。
为了实现在线库的复杂查询,你还在双写吗?
做在线业务的开发者经常会碰到这样的难题:在线数据库上面运行稍微复杂点的查询,在线业务就挂了!不管是单机数据库如MySQL、PG,还是分布式数据库,HBase、MongoDB、Cassandra都有这个问题。
当 Redis 发生高延迟时,到底发生了什么
Redis 是一种内存数据库,将数据保存在内存中,读写效率要比传统的将数据保存在磁盘上的数据库要快很多。但是 Redis 也会发生延迟时,这是就需要我们对其产生原因有深刻的了解,以便于快速排查问题,解决 Redis的延迟问题
Spark on Kubernetes & YARN
以Kubernetes为代表的云原生技术越来越流行起来,spark是如何跑在Kubernetes之上来享受云原生技术的红利?Spark跑在Kubernetes之上和跑在Hadoop YARN上又有什么区别?以及Kubernetes 和YARN的差异点是什么。讲师介绍何剑,阿里巴巴高级技术专家,专注于Kubernetes容器云和大数据底层调度以及基础架构,负责阿里巴巴容器平台在线服务和离线计算任务混部。此前就职于Hortonworks, 是Hadoop 社区Committer和PMC成员
Spotify如何使用Cassandra实现个性化推荐
本文翻译自https://labs.spotify.com/2015/01/09/personalization-at-spotify-using-cassandra/在Spotify我们有超过6000万的活跃用户,他们可以访问超过3000万首歌曲的庞大曲库。
实战教学:Cassandra常用工具详解
介绍Cassandra常用工具使用方法,使用的运维场景,原理等。讲师介绍郭泽晖(索月),阿里云数据库 技术专家,Cassandra 社区贡献者课程回顾阿里云cassandra技术架构及内核实现分布式数据库Cassandra 一致性详解分布式Cassandra的CQL使用以及业务场景分析Cassandra多语言客户端如何基于Cassandra建模?
Cassandra CDC初体验
CDC(Change data capture)是Cassandra提供的一种用于捕获和归档数据写入操作的机制,这个功能在3.8以上版本支持。当对一个表设置了“cdc=true”属性之后,包含有这个表的数据的CommitLog在丢弃时会被移动到指定的目录中,用户可以自己编写程序消费(解析并删除)这些日志,实现诸如增量数据导出、备份等功能。
Cassandra数据迁移-BulkLoad离线工具介绍
该工具通过文件流接口快速导入数据到cassandra集群,是最快地将线下数据迁移到线上cassandra集群方法之一,准备工作如下 线上cassandra集群 线下数据,sstable格式或者csv格式。
中国Cassandra技术社区第一届Meetup:Apache Cassandra 技术揭秘及实践应用
由中国 Cassandra 技术社区主办,阿里云、DataFun协办的中国Cassandra技术社区第一届Meetup:Apache Cassandra 技术揭秘及实践应用将于2019-11-16日在北京举行,来自阿里云、ScyllaDB、360等4位嘉宾的核心技术分享。
如何基于Cassandra建模?
介绍cassandra使用场景如何基于cassandra建模设计一个基于cassandra的前台系统直播嘉宾陈江(恬泰),阿里云数据库高级专家,Apache Cassandra贡献者课程回顾阿里云cassandra技术架构及内核实现分布式数据库Cassandra 一致性详解分布式Cassandra的CQL使用以及业务场景分析Cassandra多语言客户端
高性能Cassandra多语言客户端
作为全球范围内最流行的宽表数据库,Apache Cassandra具备诸多优点:海量数据存储;简洁易上手的类SQL语法;总是在线;扩容灵活等。除了服务端的各种优点之外,Cassandra对各种语言客户端(driver)的高性能支持也是其实现易用性和良好性能的重要环节。
Cassandra SASI Index 技术解密
这篇博客从技术上深入探讨了新的SASI索引,该索引可以在Cassandra中进行全文搜索(自Cassandra 3.4以来引入,但因相关重大bug的修复,我建议至少使用Cassandra 3.5以上)。
探秘 Cassandra 数据文件合并优化
前言 Cassandra是一款NoSQL分布式数据库,采用LSM Tree架构。众所周知,LSM有两个重要过程:数据顺序刷入磁盘生成数据文件(SSTable)和 数据文件合并(Compaction)。
13个Mongodb GUI可视化管理工具,总有一款适合你
本文介绍了13个好用的MongoDB可视化工具。Robomongo,MongoDB Compass,phpMoAdmin等
Cassandra多语言客户端
演示使用各种编程语言访问cassandra的示例; 以java driver为例,介绍客户端工作原理和常见用法。直播嘉宾马振林(陆豪),阿里云数据库技术专家,Apache Cassandra贡献者课程回顾阿里云cassandra技术架构及内核实现分布式数据库Cassandra 一致性详解分布式Cassandra的CQL使用以及业务场景分析
阿里HBase高可用8年“抗战”回忆录
2018年双十一,HBase全天处理请求2.4万亿行,单集群吞吐达到千万级别。从一个婴儿成长为青年,阿里HBase摔过很多次,甚至头破血流,我们在客户的信任之下幸运的成长,感激涕零。2017年开始阿里HBase走向公有云,我们有计划的在逐步将阿里内部的高可用技术提供给外部客户,目前已经上线同城主备
阿里云HBase推出普惠性高可用服务,独家支持用户的自建、混合云环境集群
阿里云HBase服务了多家金融、广告、媒体类业务中的风控和推荐,持续的在高可用、低延迟、低成本方向上进行优化。为了进一步满足客户在可用性以及低延迟上的诉求,阿里云HBase将提供以主备架构为平台,以冗余、并发、隔离、降级等全方位服务为支撑的高可用解决方案。
RDS&POLARDB归档到X-Pack Spark计算最佳实践
业务背景 对于RDS&POLARDB FOR MYSQL 有些用户场景会遇到,当一张的数据达到几千万时,你查询一次所花的时间会变多。这时候会采取水平分表的策略,水平拆分是将同一个表的数据进行分块保存到不同的数据库中,这些数据库中的表结构完全相同。
使用datax迁移cassandra数据
DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现各种异构数据源之间高效的数据同步功能。最近,阿里云cassandra团队为datax提供了cassandra读写插件,进一步丰富了datax支持的数据源,可以很方便实现cassandra之间以及cassandra与其他数据源之间的数据同步。
ApacheCon 2019 Cassandra分会各大议题深度剖析,解读cassandra前沿工作
NGCC 2019摘要 下一代Cassandra会议(NGCC)是ApacheCon 2019大会中的一场分会。 它是由开发人员,贡献者,提交者,驱动程序作者以及对Apache Cassandra开发感兴趣的人组成的年度会议,他们可以聚在一起讨论Cassandra项目的技术和社区发展方向。