如何使用Visual Studio远程调试部署在Azure上的Web App

简介:


介绍

Redis Sentinel 是一个分布式系统, 你可以在一个架构中运行多个 Sentinel 进程(progress), 这些进程使用流言协议(gossip protocols)来接收关于主服务器是否下线的信息, 并使用投票协议(agreement protocols)来决定是否执行自动故障迁移, 以及选择哪个从服务器作为新的主服务器。

虽然 Redis Sentinel 释出为一个单独的可执行文件 redis-sentinel , 但实际上它只是一个运行在特殊模式下的 Redis 服务器, 你可以在启动一个普通 Redis 服务器时通过给定 --sentinel 选项来启动 Redis Sentinel 。

Sentinel 系统用于管理多个 Redis 服务器(instance), 该系统执行以下三个任务:

  • 监控(Monitoring): Sentinel 会不断地检查你的主服务器和从服务器是否运作正常。
  • 提醒(Notification): 当被监控的某个 Redis 服务器出现问题时, Sentinel 可以通过 API 向管理员或者其他应用程序发送通知。
  • 自动故障迁移(Automatic failover): 当一个主服务器不能正常工作时, Sentinel 会开始一次自动故障迁移操作, 它会将失效主服务器的其中一个从服务器升级为新的主服务器, 并让失效主服务器的其他从服务器改为复制新的主服务器; 当客户端试图连接失效的主服务器时, 集群也会向客户端返回新主服务器的地址, 使得集群可以使用新主服务器代替失效服务器。

redis版本:3.0.7

主:6379 ,sentinel:26379

从:6380 ,sentinel:26380

配置

本章主要介绍怎样搭建自动故障转移的reids群集,当主宕机了从接替主成为新的主,宕机的主启动后自动变成了从,其实它和Mysql的双主模式是一样的互为主从;redis群集需要用到redis-sentinel程序和sentinel.conf配置文件。

主配置

vim redis.conf


 
 
  1. daemonize yes 
  2.  
  3. pidfile /usr/local/redis-6379/run/redis.pid 
  4.  
  5. port 6379 
  6.  
  7. tcp-backlog 128 
  8.  
  9. timeout 0 
  10.  
  11. tcp-keepalive 0 
  12.  
  13. loglevel notice 
  14.  
  15. logfile "" 
  16.  
  17. databases 16 
  18.  
  19. save 900 1 
  20.  
  21. save 300 10 
  22.  
  23. save 60 10000 
  24.  
  25. stop-writes-on-bgsave-error yes 
  26.  
  27. rdbcompression yes 
  28.  
  29. rdbchecksum yes 
  30.  
  31. dbfilename dump.rdb 
  32.  
  33. dir "/usr/local/redis-6379" 
  34.  
  35. masterauth "123456" 
  36.  
  37. requirepass "123456" 
  38.  
  39. slave-serve-stale-data yes 
  40.  
  41. slave-read-only yes 
  42.  
  43. repl-diskless-sync no 
  44.  
  45. repl-diskless-sync-delay 5 
  46.  
  47. repl-disable-tcp-nodelay no 
  48.  
  49. slave-priority 100 
  50.  
  51. appendonly no 
  52.  
  53. appendfilename "appendonly.aof" 
  54.  
  55. appendfsync everysec 
  56.  
  57. no-appendfsync-on-rewrite no 
  58.  
  59. auto-aof-rewrite-percentage 100 
  60.  
  61. auto-aof-rewrite-min-size 64mb 
  62.  
  63. aof-load-truncated yes 
  64.  
  65. lua-time-limit 5000 
  66.  
  67. slowlog-log-slower-than 10000 
  68.  
  69. slowlog-max-len 128 
  70.  
  71. latency-monitor-threshold 0 
  72.  
  73. notify-keyspace-events "" 
  74.  
  75. hash-max-ziplist-entries 512 
  76.  
  77. hash-max-ziplist-value 64 
  78.  
  79. list-max-ziplist-entries 512 
  80.  
  81. list-max-ziplist-value 64 
  82.  
  83. set-max-intset-entries 512 
  84.  
  85. zset-max-ziplist-entries 128 
  86.  
  87. zset-max-ziplist-value 64 
  88.  
  89. hll-sparse-max-bytes 3000 
  90.  
  91. activerehashing yes 
  92.  
  93. client-output-buffer-limit normal 0 0 0 
  94.  
  95. client-output-buffer-limit slave 256mb 64mb 60 
  96.  
  97. client-output-buffer-limit pubsub 32mb 8mb 60 
  98.  
  99. hz 10 
  100.  
  101. aof-rewrite-incremental-fsync yes 

vim sentinel.conf

群集文件配置


 
 
  1. port 26379 
  2.  
  3. dir "/usr/local/redis-6379" 
  4.  
  5. # 守护进程模式 
  6.  
  7. daemonize yes 
  8.  
  9. # 指明日志文件名 
  10.  
  11. logfile "./sentinel.log" 
  12.  
  13. sentinel monitor mymaster 192.168.137.40 6379 1 
  14.  
  15. sentinel down-after-milliseconds mymaster 5000 
  16.  
  17. sentinel failover-timeout mymaster 18000 
  18.  
  19. sentinel auth-pass mymaster 123456 

从配置

vim redis.conf


 
 
  1. daemonize yes 
  2.  
  3. pidfile "/usr/local/redis-6380/run/redis.pid" 
  4.  
  5. port 6380 
  6.  
  7. tcp-backlog 128 
  8.  
  9. timeout 0 
  10.  
  11. tcp-keepalive 0 
  12.  
  13. loglevel notice 
  14.  
  15. logfile "" 
  16.  
  17. databases 16 
  18.  
  19. save 900 1 
  20.  
  21. save 300 10 
  22.  
  23. save 60 10000 
  24.  
  25. stop-writes-on-bgsave-error yes 
  26.  
  27. rdbcompression yes 
  28.  
  29. rdbchecksum yes 
  30.  
  31. dbfilename "dump.rdb" 
  32.  
  33. dir "/usr/local/redis-6380" 
  34.  
  35. masterauth "123456" 
  36.  
  37. requirepass "123456" 
  38.  
  39. slave-serve-stale-data yes 
  40.  
  41. slave-read-only yes 
  42.  
  43. repl-diskless-sync no 
  44.  
  45. repl-diskless-sync-delay 5 
  46.  
  47. repl-disable-tcp-nodelay no 
  48.  
  49. slave-priority 100 
  50.  
  51. appendonly no 
  52.  
  53. appendfilename "appendonly.aof" 
  54.  
  55. appendfsync everysec 
  56.  
  57. no-appendfsync-on-rewrite no 
  58.  
  59. auto-aof-rewrite-percentage 100 
  60.  
  61. auto-aof-rewrite-min-size 64mb 
  62.  
  63. aof-load-truncated yes 
  64.  
  65. lua-time-limit 5000 
  66.  
  67. slowlog-log-slower-than 10000 
  68.  
  69. slowlog-max-len 128 
  70.  
  71. latency-monitor-threshold 0 
  72.  
  73. notify-keyspace-events "" 
  74.  
  75. hash-max-ziplist-entries 512 
  76.  
  77. hash-max-ziplist-value 64 
  78.  
  79. list-max-ziplist-entries 512 
  80.  
  81. list-max-ziplist-value 64 
  82.  
  83. set-max-intset-entries 512 
  84.  
  85. zset-max-ziplist-entries 128 
  86.  
  87. zset-max-ziplist-value 64 
  88.  
  89. hll-sparse-max-bytes 3000 
  90.  
  91. activerehashing yes 
  92.  
  93. client-output-buffer-limit normal 0 0 0 
  94.  
  95. client-output-buffer-limit slave 256mb 64mb 60 
  96.  
  97. client-output-buffer-limit pubsub 32mb 8mb 60 
  98.  
  99. hz 10 
  100.  
  101. aof-rewrite-incremental-fsync yes 

vim sentinel.conf


 
 
  1. #sentinel端口 
  2.  
  3. port 26380 
  4.  
  5. #工作路径,注意路径不要和主重复 
  6.  
  7. dir "/usr/local/redis-6380" 
  8.  
  9. # 守护进程模式 
  10.  
  11. daemonize yes 
  12.  
  13. # 指明日志文件名 
  14.  
  15. logfile "./sentinel.log" 
  16.  
  17. #哨兵监控的master,主从配置一样, 
  18.  
  19. sentinel monitor mymaster 192.168.137.40 6379 1 
  20.  
  21. # master或slave多长时间(默认30秒)不能使用后标记为s_down状态。 
  22.  
  23. sentinel down-after-milliseconds mymaster 5000 
  24.  
  25. #若sentinel在该配置值内未能完成failover操作(即故障时master/slave自动切换),则认为本次failover失败。 
  26.  
  27. sentinel failover-timeout mymaster 18000 
  28.  
  29. #设置master和slaves验证密码 
  30.  
  31. sentinel auth-pass mymaster 123456 

启动redis

主从都要启动


 
 
  1. src/redis-server redis.conf 

启动群集监控

主从都要启动


 
 
  1. src/redis-sentinel sentinel.conf --sentinel 

启动报错处理

错误1:

WARNING overcommit_memory is set to 0! Background save may fail under low memory condition. To fix this issue add 'vm.overcommit_memory = 1' to /etc/sysctl.conf and then reboot or run the command 'sysctl vm.overcommit_memory=1' for this to take effect.


 
 
  1. 两个解决方法(overcommit_memory) 
  2.  
  3. 1. echo "vm.overcommit_memory=1" > /etc/sysctl.conf 或 vi /etcsysctl.conf , 然后reboot重启机器 
  4.  
  5. 2. echo 1 > /proc/sys/vm/overcommit_memory 不需要启机器就生效 

 
 
  1. overcommit_memory参数说明: 
  2.  
  3. 设置内存分配策略(可选,根据服务器的实际情况进行设置) 
  4.  
  5. /proc/sys/vm/overcommit_memory 
  6.  
  7. 可选值:0、1、2。 
  8.  
  9. 0, 表示内核将检查是否有足够的可用内存供应用进程使用;如果有足够的可用内存,内存申请允许;否则,内存申请失败,并把错误返回给应用进程。 
  10.  
  11. 1, 表示内核允许分配所有的物理内存,而不管当前的内存状态如何。 
  12.  
  13. 2, 表示内核允许分配超过所有物理内存和交换空间总和的内存 
  14.  
  15. 注意:redis在dump数据的时候,会fork出一个子进程,理论上child进程所占用的内存和parent是一样的,比如parent占用 的内存为8G,这个时候也要同样分配8G的内存给child,如果内存无法负担,往往会造成redis服务器的down机或者IO负载过高,效率下降。所 以这里比较优化的内存分配策略应该设置为 1(表示内核允许分配所有的物理内存,而不管当前的内存状态如何)。 
  16.  
  17. 这里又涉及到Overcommit和OOM。 
  18.  
  19. 什么是Overcommit和OOM 
  20.  
  21. 在Unix中,当一个用户进程使用malloc()函数申请内存时,假如返回值是NULL,则这个进程知道当前没有可用内存空间,就会做相应的处理工作。许多进程会打印错误信息并退出。 
  22.  
  23. Linux使用另外一种处理方式,它对大部分申请内存的请求都回复"yes",以便能跑更多更大的程序。因为申请内存后,并不会马上使用内存。这种技术叫做Overcommit。 
  24.  
  25. 当内存不足时,会发生OOM killer(OOM=out-of-memory)。它会选择杀死一些进程(用户态进程,不是内核线程),以便释放内存。 
  26.  
  27. Overcommit的策略 
  28.  
  29. Linux下overcommit有三种策略(Documentation/vm/overcommit-accounting): 
  30.  
  31. 0. 启发式策略。合理的overcommit会被接受,不合理的overcommit会被拒绝。 
  32.  
  33. 1. 任何overcommit都会被接受。 
  34.  
  35. 2. 当系统分配的内存超过swap+N%*物理RAM(N%由vm.overcommit_ratio决定)时,会拒绝commit。 
  36.  
  37. overcommit的策略通过vm.overcommit_memory设置。 
  38.  
  39. overcommit的百分比由vm.overcommit_ratio设置。 
  40.  
  41. # echo 2 > /proc/sys/vm/overcommit_memory 
  42.  
  43. # echo 80 > /proc/sys/vm/overcommit_ratio 
  44.  
  45. 当oom-killer发生时,linux会选择杀死哪些进程 
  46.  
  47. 选择进程的函数是oom_badness函数(在mm/oom_kill.c中),该函数会计算每个进程的点数(0~1000)。 
  48.  
  49. 点数越高,这个进程越有可能被杀死。 
  50.  
  51. 每个进程的点数跟oom_score_adj有关,而且oom_score_adj可以被设置(-1000最低,1000最高)。 

错误2:

WARNING: The TCP backlog setting of 511 cannot be enforced because /proc/sys/net/core/somaxconn is set to the lower value of 128.


 
 
  1. echo 511 > /proc/sys/net/core/somaxconn 

错误3:

16433:X 12 Jun 14:52:37.734 * Increased maximum number of open files to 10032 (it was originally set to 1024).


 
 
  1. 新装的linux默认只有1024,当负载较大时,会经常出现error: too many open files 
  2.  
  3. ulimit -a:使用可以查看当前系统的所有限制值 
  4.  
  5. vim /etc/security/limits.conf 
  6.  
  7. 在文件的末尾加上 
  8.  
  9. * soft nofile 65535 
  10.  
  11. * hard nofile 65535 
  12.  
  13. 执行su或者重新关闭连接用户再执行ulimit -a就可以查看修改后的结果。 

故障切换机制

1. 启动群集后,群集程序默认会在从库的redis文件中加入连接主的配置


 
 
  1. # Generated by CONFIG REWRITE 
  2.  
  3. slaveof 192.168.137.40 6379 

2.启动群集之后,群集程序默认会在主从的sentinel.conf文件中加入群集信息

主:


 
 
  1. port 26379 
  2.  
  3. dir "/usr/local/redis-6379" 
  4.  
  5. # 守护进程模式 
  6.  
  7. daemonize yes 
  8.  
  9. # 指明日志文件名 
  10.  
  11. logfile "./sentinel.log" 
  12.  
  13. sentinel monitor mymaster 192.168.137.40 6379 1 
  14.  
  15. sentinel down-after-milliseconds mymaster 5000 
  16.  
  17. sentinel failover-timeout mymaster 18000 
  18.  
  19. sentinel auth-pass mymaster 123456 
  20.  
  21. # Generated by CONFIG REWRITE 
  22.  
  23. sentinel config-epoch mymaster 0 
  24.  
  25. sentinel leader-epoch mymaster 1 
  26.  
  27. sentinel known-slave mymaster 192.168.137.40 6380 
  28.  
  29. sentinel known-sentinel mymaster 192.168.137.40 26380 c77c5f64aaad0137a228875e531c7127ceeb5c3f 
  30.  
  31. sentinel current-epoch 1 

从:


 
 
  1. #sentinel端口 
  2.  
  3. port 26380 
  4.  
  5. #工作路径 
  6.  
  7. dir "/usr/local/redis-6380" 
  8.  
  9. # 守护进程模式 
  10.  
  11. daemonize yes 
  12.  
  13. # 指明日志文件名 
  14.  
  15. logfile "./sentinel.log" 
  16.  
  17. #哨兵监控的master,主从配置一样,在进行主从切换时6379会变成当前的master端口, 
  18.  
  19. sentinel monitor mymaster 192.168.137.40 6379 1 
  20.  
  21. # master或slave多长时间(默认30秒)不能使用后标记为s_down状态。 
  22.  
  23. sentinel down-after-milliseconds mymaster 5000 
  24.  
  25. #若sentinel在该配置值内未能完成failover操作(即故障时master/slave自动切换),则认为本次failover失败。 
  26.  
  27. sentinel failover-timeout mymaster 18000 
  28.  
  29. #设置master和slaves验证密码 
  30.  
  31. sentinel auth-pass mymaster 123456 
  32.  
  33. #哨兵程序自动添加的部分 
  34.  
  35. # Generated by CONFIG REWRITE 
  36.  
  37. sentinel config-epoch mymaster 0 
  38.  
  39. sentinel leader-epoch mymaster 1 
  40.  
  41. ###指明了当前群集的从库的ip和端口,在主从切换时该值会改变 
  42.  
  43. sentinel known-slave mymaster 192.168.137.40 6380 
  44.  
  45. ###除了当前的哨兵还有哪些监控的哨兵 
  46.  
  47. sentinel known-sentinel mymaster 192.168.137.40 26379 7a88891a6147e202a53601ca16a3d438e9d55c9d 
  48.  
  49. sentinel current-epoch 1 

模拟主故障


 
 
  1. [root@monitor redis-6380]# ps -ef|grep redis 
  2.  
  3. root 4171 1 0 14:20 ? 00:00:15 /usr/local/redis-6379/src/redis-server *:6379 
  4.  
  5. root 4175 1 0 14:20 ? 00:00:15 /usr/local/redis-6380/src/redis-server *:6380 
  6.  
  7. root 4305 1 0 15:28 ? 00:00:05 /usr/local/redis-6379/src/redis-sentinel *:26379 [sentinel] 
  8.  
  9. root 4306 1 0 15:28 ? 00:00:05 /usr/local/redis-6380/src/redis-sentinel *:26380 [sentinel] 
  10.  
  11. root 4337 4144 0 15:56 pts/1 00:00:00 grep redis 
  12.  
  13. [root@monitor redis-6380]# kill -9 4171 
  14.  
  15. [root@monitor redis-6380]# ps -ef|grep redis 
  16.  
  17. root 4175 1 0 14:20 ? 00:00:15 /usr/local/redis-6380/src/redis-server *:6380 
  18.  
  19. root 4305 1 0 15:28 ? 00:00:05 /usr/local/redis-6379/src/redis-sentinel *:26379 [sentinel] 
  20.  
  21. root 4306 1 0 15:28 ? 00:00:05 /usr/local/redis-6380/src/redis-sentinel *:26380 [sentinel] 
  22.  
  23. root 4339 4144 0 15:56 pts/1 00:00:00 grep redis 
  24.  
  25. [root@monitor redis-6380]# 

从哨兵配置文件中可以看到当前的主库的已经发生了改变

从日志文件也可以看到当前的主已经从6379转换成了6380

总结

redis的哨兵端口26379、26380使用客户端软件无法连接,使用程序可以连接,客户端软件只能直接连接6379和6380端口。使用哨兵监控当主故障后会自动切换从为主,当主启动后就变成了从。


作者:pursuer.chen

来源:51CTO

相关文章
|
5月前
|
存储 安全 Linux
【Azure App Service】在App Service中查看CA证书
在 Azure App Service 中,使用自签名或私有 CA 证书的远程服务可能会导致 SSL 握手失败。解决方法包括使用受信任 CA 签发的证书,或通过 App Service Environment 加载自定义根证书,实现安全连接。
144 3
|
6月前
|
域名解析 网络协议 API
【Azure Container App】配置容器应用的缩放规则 Managed Identity 连接中国区 Azure Service Bus 问题
本文介绍了在 Azure Container Apps 中配置基于自定义 Azure Service Bus 的自动缩放规则时,因未指定云环境导致的域名解析错误问题。解决方案是在扩展规则中添加 `cloud=AzureChinaCloud` 参数,以适配中国区 Azure 环境。内容涵盖问题描述、原因分析、解决方法及配置示例,适用于使用 KEDA 实现事件驱动自动缩放的场景。
163 1
|
3月前
|
Java 应用服务中间件 API
【App Service】部署War包到Azure云上遇404错误
Java应用部署至Azure App Service for Windows后报404,本地运行正常。经排查,日志提示类文件版本不兼容:应用由Java 17(class file version 61.0)编译,但环境仅支持到Java 11(55.0)。错误根源为Java版本不匹配。调整App Service的Java版本至17后问题解决,成功访问接口。
188 1
|
8月前
|
人工智能 文件存储 数据中心
Ollama部署本地大模型并通过Infortress APP远程访问保姆级教程
本文介绍如何快速上手本地大模型部署工具Ollama及AI远程访问工具Infortress。通过Ollama,开发者可轻松部署如Llama、Deepseek等主流开源模型,仅需几行命令即可完成安装与运行。结合Infortress,用户能实现对本地大模型的远程访问,支持多设备无缝对接,同时提供便捷的模型切换与知识库管理功能。Infortress更兼具NAS软件特性,成为个人AI数据中心的理想选择。
|
3月前
|
存储 Linux 网络安全
【Azure App Service】Root CA on App Service
Azure App Service for Windows应用连接外部SSL服务时,需确保其证书由受信任的根CA颁发。多租户环境下无法修改根证书,但ASE(单租户)可加载自定义CA证书。若遇证书信任问题,可更换为公共CA证书或将应用部署于ASE并导入私有CA证书。通过Kudu的PowerShell(Windows)或SSH(Linux)可查看当前受信任的根证书列表。
118 13
|
4月前
|
API 网络架构 容器
【Azure Container App】查看当前 Container App Environment 中的 CPU 使用情况的API
在扩展 Azure Container Apps 副本时,因 Container App Environment 的 CPU 核心数已达上限(500 cores),导致扩展失败。本文介绍如何使用 `az rest` 命令调用 Azure China Cloud 管理 API,查询当前环境的 CPU 使用情况,并提供具体操作步骤及示例。
162 16
|
4月前
|
数据安全/隐私保护
【Azure Function App】PowerShell Function 执行 Get-AzAccessToken 的返回值类型问题:System.String 与 System.Security.SecureString
将PowerShell Function部署到Azure Function App后,Get-AzAccessToken返回值类型在不同环境中有差异。正常为SecureString类型,但部分情况下为System.String类型,导致后续处理出错。解决方法是在profile.ps1中设置环境变量$env:AZUREPS_OUTPUT_PLAINTEXT_AZACCESSTOKEN=false,以禁用明文输出。
157 0
|
4月前
|
网络协议 Java Linux
【App Service】在Azure环境中如何查看App Service实例当前的网络连接情况呢?
在 Azure App Service(Windows 和 Linux)中部署应用时,分析网络连接状态是排查异常、验证端口监听及确认后端连接的关键。本文介绍如何在 Linux 环境中使用 `netstat` 命令查看特定端口(如 443、3306、6380)的连接情况,并解析输出结果。同时说明在 Windows App Service 中 `netstat` 被禁用的情况下,如何通过门户抓包等替代方法进行网络诊断。内容涵盖命令示例、操作步骤及附录说明,帮助开发者快速掌握云环境中的网络分析技巧。
144 11
|
7月前
|
Linux Shell 网络安全
【Azure App Service】使用 tcpping 来获取App Service的网络状态并把结果保存到文本文件中
本文针对云服务使用中网络状态抖动的问题,以Azure App Service为例,介绍如何利用其自带的`tcpping`工具检测网络连通性。通过在Windows或Linux版App Service中执行`tcpping`命令,将结果输出至文本文件,分析timeout行数以判断网络抖动的时间点。文章还提供了具体操作步骤、效果图及参考资料,帮助用户高效排查网络问题。
280 47
|
6月前
|
Java Shell Maven
【Azure Container App】构建Java应用镜像时候遇无法编译错误:ERROR [build 10/10] RUN ./mvnw.cmd dependency:go-offline -B -Dproduction package
在部署Java应用到Azure Container App时,构建镜像过程中出现错误:“./mvnw.cmd: No such file or directory”。尽管项目根目录包含mvnw和mvnw.cmd文件,但依然报错。问题出现在Dockerfile构建阶段执行`./mvnw dependency:go-offline`命令时,系统提示找不到可执行文件。经过排查,确认是mvnw文件内容异常所致。最终通过重新生成mvnw文件解决该问题,镜像成功构建。
244 1