课时2:Tair的实操流程及常见问题

本文涉及的产品
云数据库 MongoDB,独享型 2核8GB
推荐场景:
构建全方位客户视图
云原生多模数据库 Lindorm,多引擎 多规格 0-4节点
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
简介: 课时2:Tair的实操流程及常见问题

Redis入门训练营:课时2:Tair的实操流程及常见问题

课程地址:https://developer.aliyun.com/trainingcamp/5fd706c381604c09bebaf774a6290c5a?spm=a2cwt.28190922.J_8357884230.1.1e817127ycWQyx


Tair的实操流程及常见问题

 

内容介绍

一、 如何进入购买页面

二、集群模式实例容量为两GB,使用步行集群

三、连接步骤,专网、公网连接方式

四、 性能讨论

五、 关键步骤、注意事项

 

一、 如何进入购买页面

大家好,欢迎大家来参加阿里云云原生内存数据库tair的训练营活动,我是来自阿里云数据库BO的产品经理杨艳杰,接下来给大家讲解一下产品tair的购买使用,首先,我们一起来进入阿里云的首页,在左上角可以看到产品这一个,然后在下三单中,找到数据库这一边。

image.png

然后在nosql 数据库分类中,可以看到原生内存数据库tair。点击它后,进入到云原生数据库的首页。在首页上,我们可以通过点击立即开通来进行购买。

在商品类型中,tair分为两种,一个是tair for redis,还有一个是tair for graph,天讲的是主要是tair或redis完全兼容raise API的tair类型。

它的存储机制支持三种,分别是内存型、持久内存型,还有磁盘,即云模型,这三种顾名思义就是存储技术不同,一个是内存,一个是持久内存,一个是云硬盘,即我们的ESSD。

image.png

它们最大的区别在于存储介质不同而带来的性能不同,当然成本也不同,稍后再谈,这主要供不同业务阶段的客户选择。

然后在地域方面,我们这次的训练活动主要是在张家口区域,我选择了张家口区进行测试,在可用区类型模块中,如果选择单可用区,主备节点都会部署在同一个可用区,如果选择双可用区,那么主节点会在一个可用区,备节点在另一个可用区,形成一个跨机房的架构,我们这次选择了单可用区进行演示。

image.png

 

在专用网络和虚拟交换机层面,如果你之前已经设置过,它会自动加载出来,如果你没有设置过,可以点击前往进行配置,然后点击刷新按钮,就可以选择它,在版本兼容性层面,我们tair目前支持5.0API的架构类型。我们支持两种架构,一种是不启用集群,另一种是启用集群。不启用集群就是主从架构,是最基础的一主一从。启用集群后,就是rsc classes分片集群架构。rsc classes分片集群架构中,每个分片也是一个小的主从架构,所以它是带有HA的,在可靠性层面无需担心。

关于分片规则,实际上就是实例规则。当不启用集群时,我们认为它是一个单分片实例,其容量等于分片规格乘以分片数量(乘以1),例如256兆,如果启用集群,分片规格为1GB,分片数量变为两个。

这个时候集群模式实例,它的实例的容量就是一GB乘以两分片就是两GB,计算就可以了,非常简单,那我们继续用步行集群来进行。

image.png

 

二、集群模式实例容量为两 GB,使用步行集群

只读副本,由于我们目前读写分离还没有开放,所以就是不可以选的。我分片数量刚才的提到了,在不仅用集群的时候,它是一个主从架构,从架构部门理解为单分片就可以了,所以是一也不可选,那时候我们一个主从的一个tair实例就选好了,然后在密码上面了,我们最好进行设置一下,这下为了我们安全着想。它是密码,是有要求大写小写,数字,特殊字符照两三种长度是八到32位,然后特殊字库也是有限制,大家一定要看清楚再进行设置,我们现在来进行设置一下。

如果没有红色提示,就说明密码是符合规范的。然后在这里进行一个实例名的设置是可以填写,也可以不填写,都没关系的。我简单刚来输入一个,比如说是tair训练营。

image.png

我们只要点机购买,然后就会进入到我们的一个参数配置阅览界面,在这里可以看到刚才我们选中的那些所有的模块,比如说我们服务类一样存储介质,然后可用区可缺类型,还有我们的不求集群,那就是主从结构肯定是关闭了,分片规模是256兆,也就是我们当前选择了一个256兆的实例,是一个主从结构的。选择同意服务协议,然后再去点支付,然后实例就可以生成了,简单tair购买流程就到这里。

image.png

我们接下来进入第二部分,就是如何连接刚才我们购买的tair实例,那我们可以看到,就是我们现在tair实例创建好,因为tair实例创建需要一定时间,所以我把创建等待时间给省略过去,我们就直接进入到连接tair实例环节。那首先我们进入到tair实例中,然后我们可以看到位置,

image.png

它其实它支持两种连接地址,一个是专用网络,还有一个公网访问,我们通常来讲的话,都是使用专网,在阿里云内网,或者说是tairVPC 内网专有网络,还有这个交换机内网,他们网络内部的服务器之间的链接方式。我们先简单的看一下,我们在不加任何配置的时能够连通,把这个地址复制一下,然后这是我们创建的同一个网段内的一个ECS 服务器,用windows  CLI来进行连接,这时候我可以看到它其实是卡住连不上。是因为我们没有加IP白名单,我们的tile和redis其实都支持IP白名单,白名单实际上就是一个允许哪个IP地址来访问对应实例的一个功能。在我们没有添加的时候,这个IP白名单default处理,它只有本地就是12700。所以我们希望每个服务器能连接到这个T20里,我们需要把它加进去。可以通过修改来进行加载。这个时候我们就简单的可以通过查看ECS服务器地址,拿到他。然后把它粘贴进去,然后用逗号分割。

image.png

然后这个时候就已经加好,那我们再来试一下,看看能否连接。可以领取了,但是提示是验证失败。那这个时候就是我们的第二个安全层面,就是账号管理。
我们可以看到我们的tear 和它都有一个账号股。就我们常见的它其实只有一个密码功能。阿里云的riser  tair 都有用户名和密码功能,这里就需要讲一下我们的阿里云tair的账号管理体系。就阿里云tell 它支持在一个实例中创建多个账号。
我们最初的时候如果你什么账号都不创建,那么系统会给你一个默认账号。那我们可以看到这个账号名称和我们的实例ID是完全一致的。

image.png

我们可以根据自己的需要来创建多个账号,然后分给不同的业务来使用。接下来我们就随便创建一个账号。

image.png

接下来我们这个账号就创建好,tire其实它的连接有三种方式,一种是账号密码连接,一种是密码连接,还有一种是免密码连接。接下来我把这三种连接方式都演示一下,我们用最标准的方案,就是阿里云readtire,最标准的连接方案就是账号加密码方式。

刚才我们不能访问tair 实例,那是因为我们的这个tair 实例是要求使用用户名和密码来访问。然后这个时候我们把这个用户名和密码带进去,大家看一下,它的这个格式大家需要注意一下,它的格式是用户名、冒号、密码,再来看一下,又可以访问了。

还有一种情况就是有的用户他会SDK 不支持用户名加密码的这种登录方式,他希望只用密码登录,这个时候也是可以的我们需要利用我们的这个默认账号来进行,那么空密码是否实现,设置免密码访问,是可以的。
image.png

实际上,我们不建议用户开启它,因为这会增加安全性风险。如果我们看到关闭它,我们可以看到三种连接方式:用户名密码方式连接,密码方式连接,以及无密码方式连接。


三、连接步骤,专网、公网连接方式

接下来,来介绍一些实例的控制卡功能,以及按区域介绍。首先,我们需要验证实例的详细信息,包括实例名称、状态、规格、版本以及小版本等。

image.png

 

请注意小版本,如果后台发布了新的小版本,将会收到升级提示。建议在提示后尽快升级,您还可以设置维护时间段,用于执行后台维护任务,如小版本升级或服务器切换,这可以确保在维护过程中对用户的业务影响最小。

在左侧,我们有许多监控指标,如CPU使用率、读取PPS等,以实时展示实例的性能。
image.png

然而,监控信息的展示不足够,如果您希望在发生异常时得到通知,需要设置报警规则,报警规则可通过报警设置进行配置,可以设置不同的报警规则以监控各种资源,可以基于监控指标来触发报警,设置报警阈值、周期和通知方式,报警设置好后,系统将会在监控到异常时通知您,在报警规则配置好后,您可以回到监控页面查看报警信息。

image.png

 

我们还讨论了如何管理账号、修改参数、导入参数文件和查看修改历史。

image.png

此外,我们还介绍了实例复制、备份和恢复等高级功能。最后,我们将对性能分析进行更深入的讨论。

 

四、性能讨论

在高性能和低延迟响应要求的数据库中,性能和稳定性是至关重要的。通常,我们可能会遇到一些性能问题,如突然增加的延迟或响应变慢等。除了基本的性能监控,我们可以使用以下工具来分析性能:

性能监控数据:我们可以查看基本性能监控数据状态,如CPU使用率和每秒查询数 (QPS)。这些是通常用来了解数据库性能的常规指标。

日志管理-慢日志:通过记录慢日志,我们可以识别执行时间较长的查询并进行优化。慢查询日志将记录执行时间超过预设阈值的查询,您可以设置这个阈值。当设置阈值为10毫秒时,超过该阈值的日志就会被记录下来。

image.png

 

日志管理-运行日志:记录实例运行状况生成的日志。这个工具可以实时展示当前正在执行的命令和它们的访问次数。通过它,您可以了解哪些命令最频繁被执行。

image.png

 

实时 Top-Key 统计:这个功能可以实时统计每个数据库中的键值对数量。如果发现某个 Key 的数量特别多,可能需要进行优化,避免性能问题。

实时热 Key 统计:这个功能会记录那些访问频率较高的 Key。如果某个 Key 被频繁访问,可能需要注意是否需要进行缓存或其他优化。

离线全量分析:这个功能会对实例生成备份,并对备份中的所有键进行全面分析,这有助于查找未被实时统计的热键。

image.png

 

离线全量 Key 统计:相比于实时 Key 统计,全量 Key 更完整。把目前没有被实时访问到的记录大 Key 找出来。

 

image.png

image.png

 

通过这些性能分析工具,您可以更好地了解数据库的性能情况,及时发现潜在的问题并采取措施来优化性能和稳定性。

数据库内存占用高,接近内存用尽的情况下,需要考虑扩容(升级配置)。
在阿里云中,可以通过以下步骤来升级数据库实例的配置:

登录到阿里云控制台,并进入RDS管理控制台。

在左侧导航栏中,选择您的数据库实例。

在数据库实例列表中,找到需要升级配置的实例,然后单击该实例的名称以打开详细信息页面。

image.png

 

也可以在详细信息页面上,点击升级配置。

image.png 

 

在升级配置页面上,您将看到当前实例的配置信息,包括存储、架构类型等,这些通常是不可更改的。

image.png

 

在分片规格部分,选择您希望升级到的规格。您可以选择一个更大的内存规格以满足性能需求。

image.png

 

阿里云实例升降配置过程如下:先创建新实例→同步全量数据→切换 DNS →清理老实例

切换 DNS 是唯一对实例有影响的步骤。

image.png

在完成选择后,您可以在页面底部查看新配置的价格,然后单击立即支付。

阿里云将引导您完成付款过程,确认订单后,系统将开始升级配置。

请注意,升级配置可能需要一些时间来完成,您需要确保在升级期间不进行重要的数据库操作。升级后,数据库实例将具有更大的内存和性能,可以更好地满足您的需求。

在升级配置之前,建议备份数据库以防万一,并在升级后测试数据库以确保一切正常运行。

备份与恢复:

image.png

也可以手动备份:

image.png

实例恢复:生成新的实例,又称为克隆。

image.png

等待备份好后,注意添加白名单,尝试创建连接。

image.png 

image.png

 

此次备份恢复成功。


五、关键步骤、注意事项

 

image.png

 

在数据库,尤其是对性能要求高、延迟响应要求低的情况下,我们对性能和稳定性的要求非常高。有时候,我们可能会遇到一些问题,例如突然增加的延迟、响应变慢等等。为了解决这些问题,除了性能监控外,我们可以查看一些常见的性能指标,比如当前的CPU使用率、IOPS等等,这些都是标准的性能监控数据。

此外,我们还可以查看慢查询日志,即记录执行较慢的数据库查询的日志。还有一个实时的连接数监控,可以帮助我们分析实例的性能。慢查询日志记录了执行时间较长的查询,我们可以通过这些日志找到需要优化的SQL语句。

另外,还有一个记录实例运行状态的日志,虽然它与性能关系不大,但它在问题排查方面有用。我们还可以使用实时性能统计来查看当前访问的热点key,这有助于了解哪些key在被频繁访问,如果某个key的访问频率过高,我们可能需要对其进行优化或分散负载。

总之,在数据库性能排查和分析方面,我们可以通过性能监控、慢查询日志、实时连接数监控、热点key统计等工具来了解实例的性能状况,从而帮助我们更好地识别和解决性能问题。

都是在后台,采用一种对前台没有影响的方式来进行。直到切换DNS的时候,这时候是唯一对我们当前线上有影响的一个因为它需要切换DNS解析的一个调整,然后在这个过程中实例的连接会断开。

所以我们的代码可能会有一些报警。因为代码SDK有重试机制,所以会重新连接到新的实例上。然后新实例也会迅速恢复。

切换完毕之后,系统会对老实例进行一个清理,然后此时大家就完全在新实例上运行了。接下来我们来对实例进行检查。Ok,我们可以回到控制台看一下实例,这个实例经过一次变配过程,现在看到实例的编配完成,状态已经达到了一个正常运行中的状态。我们进来看一下它的规格的变化,我们可以看到它的实例规格已经变成了2GB了,然后我们再来看一下它的这些监控指标。

内存利用率可以看到,内存利用率已经从之前的78%降低到现在的9%,基本上已经达到了一个不需要扩容的目的,那么对于降级变配其实也是同样的道理,只要选择比你当前规格更小的一个规格就可以。然后和升配完全一样的,做我们正常的这些操作,升级完成以后直接立即就可以进行了。好的,这就是一个升级的操作。那接下来给大家演示一下实例的备份与恢复,那么我们可以在实例管理页面中点击左侧的备份恢复点击进入后,

我们就进入备份恢复页面。我们先看一下当前的配置。那么实例的备份保留天数是7天。然后备份周期是周一到周日,每天都会备份。那备份的实际时间是每天下午的四点到五点,是一个自动的过程。也就是说,我们的实例,每天的下午的四点到五点都会进行备份,然后备份的保留时间是7天。那么我们当然也可以手动创建一个备份。那么点击手动创建备份,再点击确定之后,备份任务就会自动地被实例进行一个新的备份。

然后我们看一下,现在备份任务已经下发了。现在我们可以看到备份已经生成完毕了,然后我们现在可以使用我们刚才备份好的备份,然后来进行一个实例的恢复,那我们的实际的恢复实际上不是在原实例上进行,而是用备份简单地在后台创建一个新的实例进行覆盖,就像克隆一样,有时候我们可以使用备份克隆出一个全新的实例,我们同样选择克隆,然后同样选择一个规格,其他都不用改,直接恢复。点击确定,这时候我们就可以看到已经选择了一个新的实例。

然后在创建完毕以后,我们再去看一下它里面有没有我们刚才备份出的那些数据?我们现在可以看到已经成功恢复了刚才备份的数据,然后我们来看看它的账号是否也在其中。账号也已经恢复了,然后我们来尝试连接一下,看看里面的数据是否还在。连接成功了,证明我这次恢复是成功的。

它其实不仅支持我们全量的数据恢复,它还支持将数据恢复到任意时间点。我们来看下面的例子,假设我的实例在2022年的10月12日的上午10:10:00 进行了一次备份。

然后绿色代表的是数据增长,不断写入,你就可以不断地增长数据,不断增长写入。然后到了2022年10月12日上午10:50:10。由于某些原因,我没有进行操作,删除了某个关键的数据项。在这种情况下,根据以前常见的恢复策略,我只能将从10:10:00备份的数据全盘还原,这将导致我从10:10:00到10:50:10之间的所有增量数据都会丢失。为了解决这个问题,我们开发了一个任意时间点恢复功能。在这个示例中,我们可以根据数据恢复功能将数据恢复到2022年11月12日上午10:04:50.009的时间点,恰好在关键数据删除之前,这样就保留了所有增量数据,这显示了它的数据任意点恢复能力。

image.png

 

至于备份和恢复方面的内容,本次课程的最后还要介绍阿里云的三大智能系统,它们分别是DAS、DMS和DTS。

实际上,这些系统对于数据库管理者(DBA)来说非常有用,因为它们可以用于监测数据库实例的健康状况,提供性能指标和趋势的收集和展示,并帮助分析慢查询、大Key、热Key以及其他不健康的情况。

此外,DAS还提供了一些功能,如弹性伸缩,以减少数据库实例的运维成本。

image.png

对于DMS,它是一个数据库管理智能管理系统,可以通过它轻松管理数据库实例,包括执行SQL查询、查看数据内容等。您可以使用DMS登录数据库并执行各种操作,使数据库管理更加便捷。

image.png

最后,DTS是一个数据迁移服务,它允许您在不同的数据库实例之间迁移数据,无论这些实例位于同一云服务提供商还是不同的云服务提供商。您可以创建任务来迁移数据,并且可以根据需要进行全量、增量或初始化迁移。这为数据管理和迁移提供了很大的灵活性。

总之,阿里云的DAS、DMS和DTS系统为数据库管理提供了强大的工具和功能,可以帮助用户更好地管理、监测、分析和迁移数据库实例,确保其性能、可用性和安全性。这些系统在云数据库管理中发挥着关键作用,为用户提供了全面的解决方案。

image.png

我们要进行连接测试,实际上是将我们自己的自建实例的数据同步到目标实例,相当于将自建的服务迁移到云上的一个实例。

 

image.png

 

进行连接测试,但在成功之前,需要选择要同步的数据库。在db0数据库中有三个键值对,所以选择将db0进行同步。配置完成后,我们进行连接测试和预检查。检查完成后,如果有警告,可以选择忽略警告,然后继续购买和启动同步任务。

直接购买并启动了DTS(数据迁移服务),然后可以看到DTS已经开始工作。DTS处于预检查阶段,登录到数据库后,发现数据已经同步过去了。

 

image.png

 

DTS实时数据同步非常方便,可以帮助我们轻松地将自建实例迁移到云上,以上是本次培训的全部内容。

 

 

相关实践学习
MySQL基础-学生管理系统数据库设计
本场景介绍如何使用DMS工具连接RDS,并使用DMS图形化工具创建数据库表。
相关文章
|
存储 NoSQL Redis
课时7:Tair生态及开源module的使用
课时7:Tair生态及开源module的使用
154 0
|
存储 缓存 运维
课时6:Tair在雪球和作业帮的使用剖析
课时6:Tair在雪球和作业帮的使用剖析
151 0
|
存储 人工智能 NoSQL
课时5:AIGC时代,Tair向量检索助力AI
课时5:AIGC时代,Tair向量检索助力AI
256 0
|
存储 JSON NoSQL
课时4:Tair在游戏行业的应用
课时4:Tair在游戏行业的应用
|
存储 缓存 NoSQL
课时1:Redis(Tair) 产品介绍
课时1:Redis(Tair) 产品介绍
251 0
|
存储 弹性计算 运维
Tair 的实操流程及常见问题 | 学习笔记
快速学习 Tair 的实操流程及常见问题
807 0
Tair 的实操流程及常见问题 | 学习笔记
|
存储 弹性计算 缓存
轻松学习阿里云原生内存数据库Tair
云原生数据库指的是基于云架构的云数据库,是一种云原生数据基础设施;是一种完全利用公有云优势的数据库服务;其本身匹配云环境和分布式事务,一般提供计算存储分离和日志即数据能力,其核心是存储与计算分离。具有弹性伸缩能力、无服务器(Serverless)、高性能、高可扩展、一致性、容错、易于管理和多云支持等特性。云原生数据库(Cloud-NativeDatabase)概念源于国外,随之受到国内厂商的关注,适用于软件工程、计算机、云计算等领域。
轻松学习阿里云原生内存数据库Tair
|
弹性计算 NoSQL 算法
阿里云Redis与Tair压力测评
无意中发现阿里云开发社区的训练营活动,其中有一个7天玩转Redis、tair训练营计划,里面可以免费领取三个月的试用礼包,因为是参营任务,不领取都不行的那种,领取之后放着也是放着,不如跑跑数据看看Redis和Tair的性能有什么区别,简单的压力测试下,本次测试并不精确,也不具有太多参考意义,真的就是为了测试而测试。
268 0
|
Cloud Native NoSQL 数据库
《阿里云产品手册2022-2023 版》——云原生内存数据库 Tair
《阿里云产品手册2022-2023 版》——云原生内存数据库 Tair
140 0
下一篇
无影云桌面