<html>
<head>
<style><!--
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
font-size: 10pt;
font-family:Tahoma
}
--></style>
</head>
<body class='hmmessage'>
&nbsp;<BR>
Our current DRBD version is 8.0.16. We are constrained by the linux kernel version we are using to upgrade to latest drbd version.<BR>
&nbsp;<BR>
In this version&nbsp;after 70 - 80 failovers,&nbsp;we see that on board that becomes cluster-primary FSCK -fy fixes some inodes.<BR>
This change in inodes is not being replicated to standby board. <BR>
If we perform failover at this stage, standby board that becomes primary shows file corruption.<BR>
File Corruption =&gt; Content of one file is seen in another file. <BR>
&nbsp;<BR>
<STRONG>Some one can help us with DRBD version which fixed this sync issue.</STRONG><BR>
&nbsp;<BR>
<STRONG>Solution:</STRONG><BR>
In Run Level 3 we start a script to check the status of DRBD. If it is not in expected state then we run recovery. This change helped us clock 500+ failovers without any issue.<BR>
&nbsp;<BR>
Code Excerpts:<BR>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; create_md="NO"<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; cur_sta=`$DRBDADM state all`<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; pri_sec=`echo $cur_sta | awk -F/ '{print $1}'`<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; peer_st=`echo $cur_sta | awk -F/ '{print $2}'`<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; cstate=`$DRBDADM cstate all`<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; if [ "$pri_sec" = "Secondary" -a "$peer_st" = "Primary" -a "$cstate" = "WFBitMapT" ]; then<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; create_md="YES"<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; fi<BR>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; if [ "$pri_sec" = "Secondary" -a "$peer_st" = "Unknown" -a "$cstate" = "WFConnection" ]; then<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; cat /proc/drbd | grep "ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0" &gt; /dev/null 2&gt;&amp;1<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; if [ $? -eq 0 ]; then<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; create_md="YES"<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; fi<BR>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; fi<BR><BR><BR>Thanks and Regards,<BR>
Lak<BR><BR>&nbsp;<BR>&gt; Date: Sat, 18 Sep 2010 04:54:05 -0500<BR>&gt; From: lxnf98mm@comcast.net<BR>&gt; To: putcha_laks@hotmail.com<BR>&gt; CC: dbarker@visioncomm.net; drbd-user@lists.linbit.com<BR>&gt; Subject: Re: [DRBD-user] drbd and fsck<BR>&gt; <BR>&gt; On Sat, 18 Sep 2010, putcha narayana wrote:<BR>&gt; <BR>&gt; &gt;<BR>&gt; &gt;<BR>&gt; &gt; FYI: If you run fsck on one node and it prints "FILE SYSTEM HAS BEEN MODIFIED", use external script to run full sync on the other board. without this sync we are seeing file corruption during failovers.<BR>&gt; <BR>&gt; Would you give an example of the external script<BR>&gt; <BR>&gt; &gt;<BR>&gt; &gt; THANKS AND REGARDSLAK<BR>&gt; &gt;<BR>&gt; &gt;<BR>&gt; &gt;<BR>&gt; &gt;&gt; From: dbarker@visioncomm.net<BR>&gt; &gt;&gt; To: drbd-user@lists.linbit.com<BR>&gt; &gt;&gt; Date: Thu, 16 Sep 2010 12:37:52 -0400<BR>&gt; &gt;&gt; Subject: Re: [DRBD-user] drbd and fsck<BR>&gt; &gt;&gt;<BR>&gt; &gt;&gt; On 09/15/2010 03:06 PM, lxnf98mm@comcast.net wrote:<BR>&gt; &gt;&gt;<BR>&gt; &gt;&gt;&gt; I have a ext3 filesystem on drbd<BR>&gt; &gt;&gt;&gt; When I run fsck should I run it on all nodes[?]<BR>&gt; &gt;&gt;<BR>&gt; &gt;&gt; You probably want to run verify to check that the images are in sync. fsck<BR>&gt; &gt;&gt; the primary, verify the resource.<BR>&gt; &gt;&gt;<BR>&gt; &gt;&gt; It "sounds" like you want to know both copies are good.<BR>&gt; &gt;&gt;<BR>&gt; &gt;&gt; Dan in Atlanta<BR>&gt; &gt;&gt;<BR>&gt; &gt;&gt; _______________________________________________<BR>&gt; &gt;&gt; drbd-user mailing list<BR>&gt; &gt;&gt; drbd-user@lists.linbit.com<BR>&gt; &gt;&gt; http://lists.linbit.com/mailman/listinfo/drbd-user<BR>&gt; &gt;<BR>&gt; <BR>&gt; -- <BR>                                               </body>
</html>