注册 登录  
 加关注
查看详情
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

曾国藩的博客

 
 
 

日志

 
 

drbd同步复制故障案例  

2014-06-19 14:49:36|  分类: SQL/Oracle/Mysql |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

http://qinhaibo.chinacloud.org/2014/02/11/drbd%E5%90%8C%E6%AD%A5%E5%A4%8D%E5%88%B6%E6%95%85%E9%9A%9C%E6%A1%88%E4%BE%8B/

DRBD通常供我们用来进行廉价异地同步复制,目前的版本支持多种级别复制,最高可以实现完全的实时同步,在日常维护中,查看同步状态也就是必须注意的了,下面是我们一个生产环境的DRBD复制,复制的内容是MYSQL数据文件,最初的需求是用户要求MYSQL实现完全实时的异地复制,要求数据0丢失,我们知道这在MYSQL中也只有半同步复制可以实现,而且当网络状态不好的时候,也不能实现实时同步,于是就衍生出,利用DRBD的实时同步复制可以实现数据库的这个需求。这种复制是块级别的,而且两点都写完才会给用户写完的确认,否则就视为写失败,DRBD的从节点处于待命状态,当主节点故障后,从节点进行磁盘挂载,然后启动MYSQL服务,继而提供数据库服务。

昨天观察到DRBD从节点进程状态信息为:

cat /proc/drbd
version: 8.3.2 (api:88/proto:86-90)
GIT-hash: dd7985327f146f33b86d4bff5ca8c94234ce840e build by root@idc-d-1480, 2009-09-28 13:13:30
0: cs:WFConnection ro:Primary/Diskless ds:UpToDate/Diskless C r—-
ns:44312 nr:0 dw:74872 dr:44445 al:23 bm:11 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:980

 

可惜分析得出,这时从节点磁盘出现问题,导致同步过程找不到磁盘读写,这时同步已经停止,登录到从库机器,发现磁盘I/O错误,大概原因是磁盘坏了,更换新磁盘,然后进行恢复。

以下是DRBD的同步的状态说明信息:

Version :表示当前使用的DRBD的版本号

1:指的是/dev/drbd1

cs :connection state,表连接状态

ro:即roles,本地节点和远程节点的角色

ds : disk states,本地和远程节点的硬盘状态

C :表示所使用的协议是C

以下六个表示的是I/O状态标记

rs  : 表示I/O操作正在进行;s表示I/O挂起,正常的是r

-a  : a表示延迟后再同步,  -表示正常同步

-p  : p表示因为对等层启动同步挂起而引起的数据再同步的情况;-表示正常

-u  : u表示因为本地启动同步挂起而引起的数据再同步的情况;-表示正常

-d,b,n,a : d表示因为DRBD内部原因引起的I/O阻塞,类似一种过渡磁盘状态;b示备用设备I/O正在阻塞;n表示网络套接字的阻塞;a:表示同时发生I/O设备阻塞和网络阻塞

-s :  s表示当挂起更新时的活动日志时的标记;正常是-

以下的标记表示的是性能指标

ns:即network send,表示通过网络发送到对等节点的数据量,单位是Kibyte

nr:即network receive,表示通过网络接收来自对等节点的数据量,单位是Kibyte

dw:即disk write,表示写到本地资产的网络数据,单位是Kibyte

dr:即disk read,表示从本地磁盘读出的网络数据,单位是Kibyte

al:即activity log,表示对元数据的活动日志区域的更新数

bm:即bit map,表示对元数据的位图区域的更新数

lo :即local count,表示被DRBD所打开的本地I/O子系统的请求数

pe :即pending,表示发送到对等节点的请求数,但是对等节点还没有做出相应

ua :即unacknowledged,表示对等节点所接受的请求数,但是还没做出相应

ap :即application pending,表示转发到DRBD的块I/O请求数,但是还没有做出相应

ep :即epochs,表示epoch对象的数量,通常当在用 barriernone写的顺序方法而加载I/O的时候会增加

wo :即write order,表示当前所使用的写的顺序方法:bbarrier),fflush),ddrain),nnone

oos :即out of sync,表示当前还没有同步的存储量

 

  评论这张
 
阅读(436)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018