<div dir="ltr"><br><div class="gmail_quote"><br><div dir="ltr">Hi,<div><br></div><div>I have found a strange behavior. Earlier I was working on DRBD version 8.3.8 and all remains good for &quot;Digest integrity check FAILED&quot; but with recent upgrade on 8.4 started to see delay in handshake process for around 7-8 sec which is causing temporarily split-brain type situation. I am very new to DRBD so please help me find this issue.Though I am planning to avoid using 

data-integrity-alg: md5 to avoid this error. But still need to understand what has changed in DRBD that caused the issue. </div><div>I also tried updating the drbd.conf : </div><div>fence-peer &quot;/usr/lib/heartbeat/drbd-peer-outdater -t 5&quot;; </div><div> AS : fence-peer &quot;/usr/lib/heartbeat/drbd-peer-outdater -t <b>1</b>&quot;;</div><div>Still no success.  Any help or pointer is appreciated.</div><div><br></div><div>Following is the log sequence:</div><div><br></div><div>On version 8.4.11-1<br><br>Dec 25 14:29:58 t1 kernel: block drbd0: Digest integrity check FAILED: 212623024s +4096<br>Dec 25 14:29:58 t1 kernel: drbd r0: error receiving Data, e: -5 l: 4112!<br>Dec 25 14:29:58 t1 kernel: drbd r0: peer( Primary -&gt; Unknown ) conn( Connected -&gt; ProtocolError ) pdsk( UpToDate -&gt; DUnknown )<br>Dec 25 14:30:06 t1 kernel: drbd r0: Handshake successful: Agreed network protocol version 101<br>Dec 25 14:30:06 t1 kernel: drbd r0: Feature flags enabled on protocol level: 0xf TRIM THIN_RESYNC WRITE_SAME WRITE_ZEROES.<br>Dec 25 14:30:06 t1 kernel: drbd r0: Peer authenticated using 20 bytes HMAC<br>Dec 25 14:30:06 t1 kernel: drbd r0: conn( WFConnection -&gt; WFReportParams )<br>Dec 25 14:30:06 t1 kernel: drbd r0: Starting ack_recv thread (from drbd_r_r0 [46248])<br>Dec 25 14:30:06 t1 kernel: block drbd0: drbd_sync_handshake:<br>Dec 25 14:30:06 t1 kernel: block drbd0: self 0238C8E28ABB978C:0000000000000000:9B86A2A3B57BABE6:9B85A2A3B57BABE7 bits:0 flags:0<br>Dec 25 14:30:06 t1 kernel: block drbd0: peer 134DF8CBE55C5001:0238C8E28ABB978D:9B86A2A3B57BABE7:9B85A2A3B57BABE7 bits:526 flags:0<br>Dec 25 14:30:06 t1 kernel: block drbd0: uuid_compare()=-1 by rule 50<br>Dec 25 14:30:06 t1 kernel: block drbd0: peer( Unknown -&gt; Primary ) conn( WFReportParams -&gt; WFBitMapT ) pdsk( DUnknown -&gt; UpToDate )<br>Dec 25 14:30:06 t1 kernel: block drbd0: receive bitmap stats [Bytes(packets)]: plain 0(0), RLE 1215(1), total 1215; compression: 100.0%<br>Dec 25 14:30:06 t1 kernel: block drbd0: send bitmap stats [Bytes(packets)]: plain 0(0), RLE 1215(1), total 1215; compression: 100.0%<br>Dec 25 14:30:06 t1 kernel: block drbd0: conn( WFBitMapT -&gt; WFSyncUUID )<br>Dec 25 14:30:06 t1 kernel: block drbd0: updated sync uuid 0239C8E28ABB978C:0000000000000000:9B86A2A3B57BABE6:9B85A2A3B57BABE7<br>Dec 25 14:30:06 t1 kernel: block drbd0: helper command: /sbin/drbdadm before-resync-target minor-0<br>Dec 25 14:30:06 t1 kernel: block drbd0: helper command: /sbin/drbdadm before-resync-target minor-0 exit code 0 (0x0)<br>Dec 25 14:30:06 t1 kernel: block drbd0: conn( WFSyncUUID -&gt; SyncTarget ) disk( Outdated -&gt; Inconsistent )<br>Dec 25 14:30:06 t1 kernel: block drbd0: Began resync as SyncTarget (will sync 2104 KB [526 bits set]).<br><br> <br><br>On Version 8.3.8.1<br><br>Dec 2 06:23:18 t1 kernel: block drbd0: Digest integrity check FAILED.<br>Dec 2 06:23:18 t1 kernel: block drbd0: error receiving Data, l: 4136!<br>Dec 2 06:23:18 t1 kernel: block drbd0: peer( Primary -&gt; Unknown ) conn( Connected -&gt; ProtocolError ) pdsk( UpToDate -&gt; DUnknown ) <br>Dec 2 06:23:18 t1 kernel: block drbd0: asender terminated<br>Dec 2 06:23:18 t1 kernel: block drbd0: Terminating asender thread<br>Dec 2 06:23:18 t1 kernel: block drbd0: Connection closed<br>Dec 2 06:23:18 t1 kernel: block drbd0: conn( ProtocolError -&gt; Unconnected ) <br>Dec 2 06:23:18 t1 kernel: block drbd0: receiver terminated<br>Dec 2 06:23:18 t1 kernel: block drbd0: Restarting receiver thread<br>Dec 2 06:23:18 t1 kernel: block drbd0: receiver (re)started<br>Dec 2 06:23:18 t1 kernel: block drbd0: conn( Unconnected -&gt; WFConnection ) <br>Dec 2 06:23:19 t1 kernel: block drbd0: Handshake successful: Agreed network protocol version 94<br>Dec 2 06:23:19 t1 kernel: block drbd0: Peer authenticated using 20 bytes of &#39;sha1&#39; HMAC<br>Dec 2 06:23:19 t1 kernel: block drbd0: conn( WFConnection -&gt; WFReportParams ) <br>Dec 2 06:23:19 t1 kernel: block drbd0: Starting asender thread (from drbd0_receiver [1909])<br>Dec 2 06:23:19 t1 kernel: block drbd0: data-integrity-alg: md5<br>Dec 2 06:23:19 t1 kernel: block drbd0: drbd_sync_handshake:<br>Dec 2 06:23:19 t1 kernel: block drbd0: self 296E21EFF323E278:0000000000000000:404AAC56D3649880:9D5477E5D21C6D23 bits:0 flags:0<br>Dec 2 06:23:19 t1 kernel: block drbd0: peer 2DFCAA9A02C8F155:296E21EFF323E279:404AAC56D3649880:9D5477E5D21C6D23 bits:129 flags:0<br>Dec 2 06:23:19 t1 kernel: block drbd0: uuid_compare()=-1 by rule 50<br>Dec 2 06:23:19 t1 kernel: block drbd0: peer( Unknown -&gt; Primary ) conn( WFReportParams -&gt; WFBitMapT ) pdsk( DUnknown -&gt; UpToDate ) <br>Dec 2 06:23:19 t1 kernel: block drbd0: conn( WFBitMapT -&gt; WFSyncUUID ) <br>Dec 2 06:23:19 t1 kernel: block drbd0: helper command: /sbin/drbdadm before-resync-target minor-0<br>Dec 2 06:23:19 t1 kernel: block drbd0: helper command: /sbin/drbdadm before-resync-target minor-0 exit code 0 (0x0)<br>Dec 2 06:23:19 t1 kernel: block drbd0: conn( WFSyncUUID -&gt; SyncTarget ) disk( UpToDate -&gt; Inconsistent ) <br>Dec 2 06:23:19 t1 kernel: block drbd0: Began resync as SyncTarget (will sync 516 KB [129 bits set]).<br>Dec 2 06:23:19 t1 kernel: block drbd0: Resync done (total 1 sec; paused 0 sec; 516 K/sec)<br>Dec 2 06:23:19 t1 kernel: block drbd0: conn( SyncTarget -&gt; Connected ) disk( Inconsistent -&gt; UpToDate ) <br>Dec 2 06:23:19 t1 kernel: block drbd0: helper command: /sbin/drbdadm after-resync-target minor-0<br>Dec 2 06:23:19 t1 kernel: block drbd0: helper command: /sbin/drbdadm after-resync-target minor-0 exit code 0 (0x0)<br></div><div><br></div><div><br></div><div>Thanks</div><div>Vivek</div></div>
</div></div>