17 Redis主从复制及Sentinel


Redis主从复制及Sentinel

概念

  • 主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器。前者称为主节点(master/leader),后者称为从节点(slave/follower);
  • 数据的复制是单向的,只能由主节点到从节点。Master以写为主,Slave以读为主。
  • 默认情况下,每台Redis服务器都是主节点; 且一个主节点可以有多个从节点(或没有从节点),但一个从节点只能有一个主节点。
  • 主从复制的作用主要包括:
    • 1、数据冗余:主从复制实现了数据的热备份,是持久化之外的一种数据冗余方式。
    • 2、故障恢复︰当主节点出现问题时,可以由从节点提供服务,实现快速的故障恢复;实际上是一种服务的冗余。
    • 3、负载均衡︰在主从复制的基础上,配合读写分离,可以由主节点提供写服务,由从节点提供读服务(即写Redis数据时应用连接主节点,读Redis数据时应用连接从节点),分担服务器负载;尤其是在写少读多的场景下,通过多个从节点分担读负载,可以大大提高Redis服务器的并发量。
    • 4、高可用(集群)基石∶除了上述作用以外,主从复制还是哨兵和集群能够实施的基础,因此说主从复制是Redis高可用的基础。
  • 一般来说,要将Redis运用于工程项目中,只使用一台Redis是万万不能的(宕机),原因如下:
    • 1、从结构上,单个Redis服务器会发生单点故障,并且一台服务器需要处理所有的请求负载,压力较大;
    • 2、从容量上,单个Redis服务器内存容量有限,就算一台Redis服务器内存容量为256G,也不能将所有内存用作Redis存储内存,一般来说,单台Redis最大使用内存不应该超过20G。
  • 主从复制,读写分离!80%的情况下都是在进行读操作!减缓服务器的压力!架构中经常使用!一主二从!
127.0.0.1:6379> info replication    # 查看当前库信息
# Replication
role:master     # 角色
connected_slaves:0  # 没有从机
master_failover_state:no-failover
master_replid:88692a0ce486cd91a89558823706c3a158c3b320
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:0
second_repl_offset:-1
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0
127.0.0.1:6379> 

连接过程

  1. 主服务器创建快照文件,发送给从服务器,并在发送期间使用缓冲区记录执行的写命令。快照文件发送完毕之后,开始向从服务器发送存储在缓冲区中的写命令;
  2. 从服务器丢弃所有旧数据,载入主服务器发来的快照文件,之后从服务器开始接受主服务器发来的写命令;
  3. 主服务器每执行一次写命令,就向从服务器发送相同的写命令。

修改配置文件

复制3个配置文件,然后修改对应的信息

  • 1、端口
  • 2、pid名字
  • 3、log文件名字
  • 4、dump.rdb名字

修改完毕之后,启动我们的3个redis服务器,可以通过进程信息查看!

[root@centos bin]# ps -ef|grep redis
root       2948      1  0 16:55 ?        00:00:20 redis-server 127.0.0.1:6379
root       3387   3352  0 17:24 pts/2    00:00:00 redis-cli -p 6379
root       5089      1  0 19:51 ?        00:00:00 redis-server 127.0.0.1:6380
root       5096      1  0 19:52 ?        00:00:00 redis-server 127.0.0.1:6381
root       5112   2804  0 19:52 pts/0    00:00:00 grep --color=auto redis

配置从机

# slaveof host port
[root@centos bin]# redis-cli -p 6380
127.0.0.1:6380> slaveof 127.0.0.1 6379
OK
127.0.0.1:6380> info replication
# Replication
role:slave  # 当前角色
master_host:127.0.0.1
master_port:6379
master_link_status:up
master_last_io_seconds_ago:0
master_sync_in_progress:0
slave_repl_offset:56
slave_priority:100
slave_read_only:1
connected_slaves:0
master_failover_state:no-failover
master_replid:d862e2da22d4355d8304d7458e6d6bdc88500906
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:56
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:56

在主机查看配置

[root@centos bin]# redis-cli -p 6379
127.0.0.1:6379> info replication
# Replication
role:master
connected_slaves:2
slave0:ip=127.0.0.1,port=6380,state=online,offset=322,lag=1
slave1:ip=127.0.0.1,port=6381,state=online,offset=322,lag=0
master_failover_state:no-failover
master_replid:d862e2da22d4355d8304d7458e6d6bdc88500906
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:322
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:322
127.0.0.1:6379> 

细节

  • 主机可以读写,从机只能读
  • 主机断开后从机仍可以读到内容,但是没有了写操作(主机读)
  • 如果是使用命令行,来配置的主从,这个时候如果重启了,就会变回主机!
  • 如果是配置文件配置(replication),那么断开后再重启也可以读到

复制原理

  • slave启动成功连接到master后会发送一个sync同步命令
  • Master接到命令,启动后台的存盘进程,同时收集所有接收到的用于修改数据集命令,在后台进程执行完毕之后,master将传送整个数据文件到slave,并完成一次完全同步。(全量复制)
  • 全量复制︰而slave服务在接收到数据库文件数据后,将其存盘并加载到内存中。
  • 增量复制: Master继续将新的所有收集到的修改命令依次传给slave,完成同步
  • 但是只要是重新连接master,一次完全同步(全量复制)将被自动执行

主从链

随着负载不断上升,主服务器可能无法很快地更新所有从服务器,或者重新连接和重新同步从服务器将导致系统超载。为了解决这个问题,可以创建一个中间层来分担主服务器的复制工作。中间层的服务器是最上层服务器的从服务器,又是最下层服务器的主服务器


哨兵模式

(自动选举老大的模式)

slaveof no one # 如果主机宕机,可使自己成为主机

概述

主从切换技术的方法是︰当主服务器宕机后,需要手动把一台从服务器切换为主服务器,这就需要人工干预,费事费力,还会造成一段时间内服务不可用。这不是一种推荐的方式,更多时候,我们优先考虑哨兵模式。Redis从2.8开始正式提供了Sentinel (哨兵)架构来解决这个问题。

谋朝篡位的自动版,能够后台监控主机是否故障,如果故障了根据投票数自动将从库转换为主库

哨兵模式是一种特殊的模式,首先Redis提供了哨兵的命令,哨兵是一个独立的进程,作为进程,它会独立运行。其原理是哨兵通过发送命令,等待Redis服务器响应,从而监控运行的多个Redis实例。

这里的哨兵有两个作用

  • 通过发送命令,让Redis服务器返回监控其运行状态,包括主服务器和从服务器。
  • 当哨兵监测到master宕机,会自动将slave切换成master,然后通过发布订阅模式通知其他的从服务器,修改配置文件,让它们切换主机。

然而一个哨兵进程对Redis服务器进行监控,可能会出现问题,为此,我们可以使用多个哨兵进行监控。各个哨兵之间还会进行监控,这样就形成了多哨兵模式。

假设主服务器宕机r哨兵1先检测到这个结果,系统并不会马上进行failover过程,仅仅是哨兵1主观的认为主服务器不可用,这个现象成为主观下线

当后面的哨兵也检测到主服务器不可用,并且数量达到一定值时,那么哨兵之间就会进行一次投票,投票的结果由一个哨兵发起,进行failover[故障转移]操作。切换成功后,就会通过发布订阅模式,让各个哨兵把自己监控的从服务器实现切换主机,这个过程称为客观下线

1、配置哨兵配置文件sentinel.conf

cd /usr/local/bin
vim sentinel.conf
sentinel monitor myredis 127.0.0.1 6379 1

后面的这个数字1,代表主机挂了,slave投票看让谁接替成为主机,票数最多的,就会成为主机 !

2、程序启动哨兵

# 注意位置在 /usr/local/bin
[root@centos bin]# redis-sentinel sentinel.conf
6263:X 06 Apr 2021 21:36:44.622 # oO0OoO0OoO0Oo Redis is starting oO0OoO0OoO0Oo
6263:X 06 Apr 2021 21:36:44.622 # Redis version=6.2.1, bits=64, commit=00000000, modified=0, pid=6263, just started
6263:X 06 Apr 2021 21:36:44.622 # Configuration loaded
6263:X 06 Apr 2021 21:36:44.622 * Increased maximum number of open files to 10032 (it was originally set to 1024).
6263:X 06 Apr 2021 21:36:44.622 * monotonic clock: POSIX clock_gettime
                _._                                                  
           _.-``__ ''-._                                             
      _.-``    `.  `_.  ''-._           Redis 6.2.1 (00000000/0) 64 bit
  .-`` .-```.  ```\/    _.,_ ''-._                                   
 (    '      ,       .-`  | `,    )     Running in sentinel mode
 |`-._`-...-` __...-.``-._|'` _.-'|     Port: 26379
 |    `-._   `._    /     _.-'    |     PID: 6263
  `-._    `-._  `-./  _.-'    _.-'                                   
 |`-._`-._    `-.__.-'    _.-'_.-'|                                  
 |    `-._`-._        _.-'_.-'    |           http://redis.io        
  `-._    `-._`-.__.-'_.-'    _.-'                                   
 |`-._`-._    `-.__.-'    _.-'_.-'|                                  
 |    `-._`-._        _.-'_.-'    |                                  
  `-._    `-._`-.__.-'_.-'    _.-'                                   
      `-._    `-.__.-'    _.-'                                       
          `-._        _.-'                                           
              `-.__.-'                                               

6263:X 06 Apr 2021 21:36:44.638 # WARNING: The TCP backlog setting of 511 cannot be enforced because /proc/sys/net/core/somaxconn is set to the lower value of 128.
6263:X 06 Apr 2021 21:36:44.650 # Sentinel ID is 0f72a8dd4a0897da343cca5c89d8db5c32862eae
6263:X 06 Apr 2021 21:36:44.650 # +monitor master myredis 127.0.0.1 6379 quorum 1
6263:X 06 Apr 2021 21:36:44.655 * +slave slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6379
6263:X 06 Apr 2021 21:36:44.671 * +slave slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6379

哨兵日志

6263:X 06 Apr 2021 21:36:44.638 # WARNING: The TCP backlog setting of 511 cannot be enforced because /proc/sys/net/core/somaxconn is set to the lower value of 128.
6263:X 06 Apr 2021 21:36:44.650 # Sentinel ID is 0f72a8dd4a0897da343cca5c89d8db5c32862eae
6263:X 06 Apr 2021 21:36:44.650 # +monitor master myredis 127.0.0.1 6379 quorum 1
6263:X 06 Apr 2021 21:36:44.655 * +slave slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6379
6263:X 06 Apr 2021 21:36:44.671 * +slave slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6379
6263:X 06 Apr 2021 21:40:18.293 # +sdown master myredis 127.0.0.1 6379
6263:X 06 Apr 2021 21:40:18.293 # +odown master myredis 127.0.0.1 6379 #quorum 1/1
6263:X 06 Apr 2021 21:40:18.293 # +new-epoch 1
6263:X 06 Apr 2021 21:40:18.293 # +try-failover master myredis 127.0.0.1 6379
6263:X 06 Apr 2021 21:40:18.328 # +vote-for-leader 0f72a8dd4a0897da343cca5c89d8db5c32862eae 1
6263:X 06 Apr 2021 21:40:18.328 # +elected-leader master myredis 127.0.0.1 6379
6263:X 06 Apr 2021 21:40:18.328 # +failover-state-select-slave master myredis 127.0.0.1 6379
6263:X 06 Apr 2021 21:40:18.383 # +selected-slave slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6379
6263:X 06 Apr 2021 21:40:18.383 * +failover-state-send-slaveof-noone slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6379
6263:X 06 Apr 2021 21:40:18.446 * +failover-state-wait-promotion slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6379
6263:X 06 Apr 2021 21:40:19.251 # +promoted-slave slave 127.0.0.1:6381 127.0.0.1 6381 @ myredis 127.0.0.1 6379
6263:X 06 Apr 2021 21:40:19.251 # +failover-state-reconf-slaves master myredis 127.0.0.1 6379
6263:X 06 Apr 2021 21:40:19.291 * +slave-reconf-sent slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6379
6263:X 06 Apr 2021 21:40:20.267 * +slave-reconf-inprog slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6379
6263:X 06 Apr 2021 21:40:20.267 * +slave-reconf-done slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6379
6263:X 06 Apr 2021 21:40:20.367 # +failover-end master myredis 127.0.0.1 6379
6263:X 06 Apr 2021 21:40:20.367 # +switch-master myredis 127.0.0.1 6379 127.0.0.1 6381
6263:X 06 Apr 2021 21:40:20.367 * +slave slave 127.0.0.1:6380 127.0.0.1 6380 @ myredis 127.0.0.1 6381
6263:X 06 Apr 2021 21:40:20.367 * +slave slave 127.0.0.1:6379 127.0.0.1 6379 @ myredis 127.0.0.1 6381
6263:X 06 Apr 2021 21:40:50.368 # +sdown slave 127.0.0.1:6379 127.0.0.1 6379 @ myredis 127.0.0.1 6381

如果主机此时回来了,只能归并到新的主机下,当做从机,这就是哨兵模式的规则!

哨兵模式

优点:

  • 1、哨兵集群,基于主从复制模式,所有的主从配置优点,它全有
  • 2、主从可以切换,故障可以转移,系统的可用性就会更好
  • 3、哨兵模式就是主从模式的升级,手动到自动,更加健壮!

缺点︰

  • 1、Redis 不好啊在线扩容的,集群容量一旦到达上限,在线扩容就十分麻烦!
  • 2、实现哨兵模式的配置其实是很麻烦的,里面有很多选择!

文章作者: Hailong Gao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Hailong Gao !
评论
  目录