<html>
<head>
<style><!--
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
font-size: 12pt;
font-family:Calibri
}
--></style></head>
<body class='hmmessage'><div dir='ltr'>Hi Friends,<br><br>We are having DRBD 8.3.13 running on RHEL 6.4 for a two node cluster. Yesterday we applied OS patches on these servers and restarted them into new kernel. After restart DRBD sync is getting stalled at 100%. I tried to reboot into old kernel also but same issue. I also tried drbdadm disconnect --force r0 and then connect but still it is stalling at 100%. Below are my config file.<br><br>Primary :<br><br>cat /proc/drbd<br>version: 8.3.13 (api:88/proto:86-96)<br>GIT-hash: 83ca112086600faacab2f157bc5a9324f7bd7f77 build by dag@Build64R6, 2012-09-04 12:06:10<br>&nbsp;0: cs:SyncSource ro:Primary/Secondary ds:UpToDate/Inconsistent C r-----<br>&nbsp;&nbsp;&nbsp; ns:1303160 nr:0 dw:1303160 dr:5501409 al:614 bm:1 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:360<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; [===================&gt;] sync'ed:100.0% (360/360)K<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; finish: 0:53:10 speed: 0 (0) K/sec<br><br>Secondary :<br><br>cat /proc/drbd<br>version: 8.3.13 (api:88/proto:86-96)<br>GIT-hash: 83ca112086600faacab2f157bc5a9324f7bd7f77 build by dag@Build64R6, 2012-09-04 12:06:10<br>&nbsp;0: cs:SyncTarget ro:Secondary/Primary ds:Inconsistent/UpToDate C r-----<br>&nbsp;&nbsp;&nbsp; ns:0 nr:58460 dw:3583548 dr:0 al:0 bm:26 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:360<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; [===================&gt;] sync'ed:100.0% (360/360)K<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; finish: 1:05:06 speed: 0 (0) want: 30 K/sec<br><br>drbd.conf :<br><br>skip {<br>&nbsp; As you can see, you can also comment chunks of text<br>&nbsp; with a 'skip[optional nonsense]{ skipped text }' section.<br>&nbsp; This comes in handy, if you just want to comment out<br>&nbsp; some 'resource &lt;some name&gt; {...}' section:<br>&nbsp; just precede it with 'skip'.<br><br>&nbsp; The basic format of option assignment is<br>&nbsp; &lt;option name&gt;&lt;linear whitespace&gt;&lt;value&gt;;<br><br>&nbsp; It should be obvious from the examples below,<br>&nbsp; but if you really care to know the details:<br><br>&nbsp; &lt;option name&gt; :=<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; valid options in the respective scope<br>&nbsp; &lt;value&gt;&nbsp; := &lt;num&gt;|&lt;string&gt;|&lt;choice&gt;|...<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; depending on the set of allowed values<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; for the respective option.<br>&nbsp; &lt;num&gt;&nbsp;&nbsp;&nbsp; := [0-9]+, sometimes with an optional suffix of K,M,G<br>&nbsp; &lt;string&gt; := (&lt;name&gt;|\"([^\"\\\n]*|\\.)*\")+<br>&nbsp; &lt;name&gt;&nbsp;&nbsp; := [/_.A-Za-z0-9-]+<br>}<br><br>#<br># At most ONE global section is allowed.<br># It must precede any resource section.<br>#<br>global {<br>&nbsp;&nbsp;&nbsp; # By default we load the module with a minor-count of 32. In case you<br>&nbsp;&nbsp;&nbsp; # have more devices in your config, the module gets loaded with<br>&nbsp;&nbsp;&nbsp; # a minor-count that ensures that you have 10 minors spare.<br>&nbsp;&nbsp;&nbsp; # In case 10 spare minors are too little for you, you can set the<br>&nbsp;&nbsp;&nbsp; # minor-count exeplicit here. ( Note, in contrast to DRBD-0.7 an<br>&nbsp;&nbsp;&nbsp; # unused, spare minor has only a very little overhead of allocated<br>&nbsp;&nbsp;&nbsp; # memory (a single pointer to be exact). )<br>&nbsp;&nbsp;&nbsp; #<br>&nbsp;&nbsp;&nbsp; # minor-count 64;<br><br>&nbsp;&nbsp;&nbsp; # The user dialog counts and displays the seconds it waited so<br>&nbsp;&nbsp;&nbsp; # far. You might want to disable this if you have the console<br>&nbsp;&nbsp;&nbsp; # of your server connected to a serial terminal server with<br>&nbsp;&nbsp;&nbsp; # limited logging capacity.<br>&nbsp;&nbsp;&nbsp; # The Dialog will print the count each 'dialog-refresh' seconds,<br>&nbsp;&nbsp;&nbsp; # set it to 0 to disable redrawing completely. [ default = 1 ]<br>&nbsp;&nbsp;&nbsp; #<br>&nbsp;&nbsp;&nbsp; # dialog-refresh 5; # 5 seconds<br><br>&nbsp;&nbsp;&nbsp; # You might disable one of drbdadm's sanity check.<br>&nbsp;&nbsp;&nbsp; # disable-ip-verification;<br><br>&nbsp;&nbsp;&nbsp; # Participate in DRBD's online usage counter at http://usage.drbd.org<br>&nbsp;&nbsp;&nbsp; # possilbe options: ask, yes, no. Default is ask. In case you do not<br>&nbsp;&nbsp;&nbsp; # know, set it to ask, and follow the on screen instructions later.<br>&nbsp;&nbsp;&nbsp; usage-count no;<br>}<br><br><br>#<br># The common section can have all the sections a resource can have but<br># not the host section (started with the "on" keyword).<br># The common section must precede all resources.<br># All resources inherit the settings from the common section.<br># Whereas settings in the resources have precedence over the common<br># setting.<br>#<br><br>common {<br>&nbsp; syncer { rate 3M; }<br>}<br><br>resource r0 {<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; protocol C;<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #incon-degr-cmd "halt -f";<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; startup {<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; degr-wfc-timeout 120;&nbsp;&nbsp;&nbsp; # 2 minutes.<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; }<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; disk {<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; on-io-error&nbsp;&nbsp; detach;<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; }<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; handlers<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; {<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; split-brain "/root/splitbrain.sh root";<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; }<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; net {<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; }<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; syncer {<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; rate 30;<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; #group 1;<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; al-extents 257;<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; }<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; on Primary {<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; device&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /dev/drbd0;<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; meta-disk&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /dev/sdb1[0];<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; disk&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /dev/sdb2;<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; address&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; xxx.xxx.xxx.xxx:7788;<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; }<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; on Secondary {<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; device&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /dev/drbd0;<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; meta-disk&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /dev/sdb1[0];<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; disk&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /dev/sdb2;<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; address&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; xxx.xxx.xxx.xxx:7788;<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; }<br>}<br><br><br>logs :<br><br>Sep 28 08:16:30 secondary kernel: block drbd0: peer( Primary -&gt; Unknown ) conn( SyncTarget -&gt; Disconnecting ) pdsk( UpToDate -&gt; DUnknown )<br>Sep 28 08:16:30 secondary kernel: block drbd0: asender terminated<br>Sep 28 08:16:30 secondary kernel: block drbd0: Terminating asender thread<br>Sep 28 08:16:30 secondary kernel: block drbd0: bitmap WRITE of 1599 pages took 34 jiffies<br>Sep 28 08:16:30 secondary kernel: block drbd0: 360 KB (90 bits) marked out-of-sync by on disk bit-map.<br>Sep 28 08:16:30 secondary kernel: block drbd0: Connection closed<br>Sep 28 08:16:30 secondary kernel: block drbd0: conn( Disconnecting -&gt; StandAlone )<br>Sep 28 08:16:30 secondary kernel: block drbd0: receiver terminated<br>Sep 28 08:16:30 secondary kernel: block drbd0: Terminating receiver thread<br>Sep 28 08:16:33 secondary kernel: block drbd0: conn( StandAlone -&gt; Unconnected )<br>Sep 28 08:16:33 secondary kernel: block drbd0: Starting receiver thread (from drbd0_worker [1765])<br>Sep 28 08:16:33 secondary kernel: block drbd0: receiver (re)started<br>Sep 28 08:16:33 secondary kernel: block drbd0: conn( Unconnected -&gt; WFConnection )<br>Sep 28 08:16:33 secondary kernel: block drbd0: Handshake successful: Agreed network protocol version 96<br>Sep 28 08:16:33 secondary kernel: block drbd0: conn( WFConnection -&gt; WFReportParams )<br>Sep 28 08:16:33 secondary kernel: block drbd0: Starting asender thread (from drbd0_receiver [29181])<br>Sep 28 08:16:33 secondary kernel: block drbd0: data-integrity-alg: &lt;not-used&gt;<br>Sep 28 08:16:33 secondary kernel: block drbd0: drbd_sync_handshake:<br>Sep 28 08:16:33 secondary kernel: block drbd0: self 5F0D0794C3189654:0000000000000000:31D1206D1558C3A2:31D0206D1558C3A3 bits:90 flags:0<br>Sep 28 08:16:33 secondary kernel: block drbd0: peer EF964F9B847F7A89:5F0D0794C3189655:5F0C0794C3189655:5F0B0794C3189655 bits:90 flags:0<br>Sep 28 08:16:33 secondary kernel: block drbd0: uuid_compare()=-1 by rule 50<br>Sep 28 08:16:33 secondary kernel: block drbd0: Becoming sync target due to disk states.<br>Sep 28 08:16:33 secondary kernel: block drbd0: peer( Unknown -&gt; Primary ) conn( WFReportParams -&gt; WFBitMapT ) pdsk( DUnknown -&gt; UpToDate )<br>Sep 28 08:16:33 secondary kernel: block drbd0: conn( WFBitMapT -&gt; WFSyncUUID )<br>Sep 28 08:16:33 secondary kernel: block drbd0: updated sync uuid 5F0E0794C3189654:0000000000000000:31D1206D1558C3A2:31D0206D1558C3A3<br>Sep 28 08:16:33 secondary kernel: block drbd0: helper command: /sbin/drbdadm before-resync-target minor-0<br>Sep 28 08:16:33 secondary kernel: block drbd0: helper command: /sbin/drbdadm before-resync-target minor-0 exit code 0 (0x0)<br>Sep 28 08:16:33 secondary kernel: block drbd0: conn( WFSyncUUID -&gt; SyncTarget )<br>Sep 28 08:16:33 secondary kernel: block drbd0: Began resync as SyncTarget (will sync 360 KB [90 bits set]).<br><br>Appreciate any help.<br><br>Thanks,<br>Vjay<br>                                               </div></body>
</html>