<div><br></div><div>hI:<div style="line-height: 21px;">&nbsp; &nbsp;i am from china,i have a &nbsp;some serious problem with my drbd,we did a ha for our mysql database with drbd ,everything is ok when we did not use NIC bond,but when we bond the nic with mode 1(active-backup),the link between the drbd perfom strange,just disconect-unknown-connect,following is the log:</div><div style="line-height: 21px;">------------------------------</div><div style="line-height: 21px;"><br></div><div style="line-height: 21px;"><div>Mar 27 13:57:58 mysql03 kernel: block drbd0: updated sync UUID B0A60E84594BD05F:9C83E27AB8FC9A75:9C82E27AB8FC9A75:9C81E27AB8FC9A75</div><div>Mar 27 13:57:58 mysql03 kernel: block drbd0: Digest mismatch, buffer modified by upper layers during write: 999570272s +4096</div><div>Mar 27 13:57:58 mysql03 kernel: drbd clusterdb_res: sock was shut down by peer</div><div>Mar 27 13:57:58 mysql03 kernel: drbd clusterdb_res: peer( Secondary -&gt; Unknown ) conn( SyncSource -&gt; BrokenPipe )</div><div>Mar 27 13:57:58 mysql03 kernel: drbd clusterdb_res: short read (expected size 16)</div><div>Mar 27 13:57:58 mysql03 kernel: drbd clusterdb_res: asender terminated</div><div>Mar 27 13:57:58 mysql03 kernel: drbd clusterdb_res: Terminating drbd_a_clusterd</div><div>Mar 27 13:57:58 mysql03 kernel: drbd clusterdb_res: Connection closed</div><div>Mar 27 13:57:58 mysql03 kernel: drbd clusterdb_res: conn( BrokenPipe -&gt; Unconnected )</div><div>Mar 27 13:57:58 mysql03 kernel: drbd clusterdb_res: receiver terminated</div><div>Mar 27 13:57:58 mysql03 kernel: drbd clusterdb_res: Restarting receiver thread</div><div>Mar 27 13:57:58 mysql03 kernel: drbd clusterdb_res: receiver (re)started</div><div>Mar 27 13:57:58 mysql03 kernel: drbd clusterdb_res: conn( Unconnected -&gt; WFConnection )</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: Handshake successful: Agreed network protocol version 101</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: Agreed to support TRIM on protocol level</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: Peer authenticated using 20 bytes HMAC</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: conn( WFConnection -&gt; WFReportParams )</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: Starting asender thread (from drbd_r_clusterd [60474])</div><div>Mar 27 13:57:59 mysql03 kernel: block drbd0: drbd_sync_handshake:</div><div>Mar 27 13:57:59 mysql03 kernel: block drbd0: self B0A60E84594BD05F:9C83E27AB8FC9A75:9C82E27AB8FC9A75:9C81E27AB8FC9A75 bits:155141533 flags:0</div><div>Mar 27 13:57:59 mysql03 kernel: block drbd0: peer 9C83E27AB8FC9A74:0000000000000000:86B283665E3AEF84:86B183665E3AEF85 bits:155141256 flags:0</div><div>Mar 27 13:57:59 mysql03 kernel: block drbd0: uuid_compare()=1 by rule 70</div><div>Mar 27 13:57:59 mysql03 kernel: block drbd0: Becoming sync source due to disk states.</div><div>Mar 27 13:57:59 mysql03 kernel: block drbd0: peer( Unknown -&gt; Secondary ) conn( WFReportParams -&gt; WFBitMapS )</div><div>Mar 27 13:57:59 mysql03 kernel: block drbd0: send bitmap stats [Bytes(packets)]: plain 0(0), RLE 952(1), total 952; compression: 100.0%</div><div>Mar 27 13:57:59 mysql03 kernel: block drbd0: receive bitmap stats [Bytes(packets)]: plain 0(0), RLE 952(1), total 952; compression: 100.0%</div><div>Mar 27 13:57:59 mysql03 kernel: block drbd0: helper command: /sbin/drbdadm before-resync-source minor-0</div><div>Mar 27 13:57:59 mysql03 kernel: block drbd0: helper command: /sbin/drbdadm before-resync-source minor-0 exit code 0 (0x0)</div><div>Mar 27 13:57:59 mysql03 kernel: block drbd0: conn( WFBitMapS -&gt; SyncSource )</div><div>Mar 27 13:57:59 mysql03 kernel: block drbd0: Began resync as SyncSource (will sync 620566148 KB [155141537 bits set]).</div><div>Mar 27 13:57:59 mysql03 kernel: block drbd0: updated sync UUID B0A60E84594BD05F:9C84E27AB8FC9A75:9C83E27AB8FC9A75:9C82E27AB8FC9A75</div><div>Mar 27 13:57:59 mysql03 kernel: block drbd0: Digest mismatch, buffer modified by upper layers during write: 999570424s +4096</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: sock was shut down by peer</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: peer( Secondary -&gt; Unknown ) conn( SyncSource -&gt; BrokenPipe )</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: short read (expected size 16)</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: asender terminated</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: Terminating drbd_a_clusterd</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: Connection closed</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: conn( BrokenPipe -&gt; Unconnected )</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: receiver terminated</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: Restarting receiver thread</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: receiver (re)started</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: conn( Unconnected -&gt; WFConnection )</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: Handshake successful: Agreed network protocol version 101</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: Agreed to support TRIM on protocol level</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: Peer authenticated using 20 bytes HMAC</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: conn( WFConnection -&gt; WFReportParams )</div><div>Mar 27 13:57:59 mysql03 kernel: drbd clusterdb_res: Starting asender thread (from drbd_r_clusterd [60474])</div><div>Mar 27 13:57:59 mysql03 kernel: block drbd0: drbd_sync_handshake:</div></div><div style="line-height: 21px;"><br></div><div style="line-height: 21px;"><br></div><div style="line-height: 21px;">---------------------------------------------------------</div><div style="line-height: 21px;"><br></div><div style="line-height: 21px;"><br></div><div style="line-height: 21px;"><br></div><div style="line-height: 21px;">and this hanppend again and again</div><div style="line-height: 21px;">we can not find where the problem is ,i have read the DRBD'S user guide,it recommand to use bond with mode active-backup,i want to know is it the problem for our situation?</div><div style="line-height: 21px;"><br></div><div style="line-height: 21px;"><span style="line-height: 1.5;">the following &nbsp;is our config:</span></div><div style="line-height: 21px;"><span style="line-height: 1.5;"><br></span></div><div style="line-height: 21px;"><div>resource &nbsp;clusterdb_res {</div><div>&nbsp; device &nbsp; &nbsp; &nbsp; &nbsp;/dev/drbd0;</div><div>&nbsp; disk &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;/dev/sda3;</div><div>&nbsp; meta-disk &nbsp; &nbsp; internal;</div><div>&nbsp; on mysql03 {</div><div>&nbsp; &nbsp; address &nbsp; &nbsp; 10.10.10.70:7791;</div><div>&nbsp; }</div><div>&nbsp; on mysql01 {</div><div>&nbsp; &nbsp; address &nbsp; &nbsp; 10.10.10.71:7791;</div><div>&nbsp; }</div><div>}</div><div><br></div><div><div>[root@mysql03 drbd.d]# cat global_common.conf</div><div>global {</div><div>&nbsp; &nbsp; &nbsp; &nbsp; usage-count yes;</div><div>}</div><div><br></div><div>common &nbsp;{</div><div>&nbsp; &nbsp; &nbsp; &nbsp; protocol C;</div><div><br></div><div>&nbsp; &nbsp; &nbsp; &nbsp; handlers {</div><div>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; pri-on-incon-degr "/usr/lib/drbd/notify-pri-on-incon-degr.sh; /usr/lib/drbd/notify-emergency-reboot.sh; echo b &gt; /proc/sysrq-trigger ; reboot -f";</div><div>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; pri-lost-after-sb "/usr/lib/drbd/notify-pri-lost-after-sb.sh; /usr/lib/drbd/notify-emergency-reboot.sh; echo b &gt; /proc/sysrq-trigger ; reboot -f";</div><div>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; local-io-error "/usr/lib/drbd/notify-io-error.sh; /usr/lib/drbd/notify-emergency-shutdown.sh; echo o &gt; /proc/sysrq-trigger ; halt -f";</div><div>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; fence-peer "/usr/lib/drbd/crm-fence-peer.sh";</div><div>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; #split-brain "/usr/lib/drbd/notify-split-brain.sh root";</div><div>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; #out-of-sync "/usr/lib/drbd/notify-out-of-sync.sh root";</div><div>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; after-resync-target "/usr/lib/drbd/crm-unfence-peer.sh";</div><div>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;}</div><div><br></div><div>&nbsp; &nbsp; &nbsp; &nbsp; startup {</div><div>&nbsp; &nbsp; &nbsp; &nbsp; }</div><div><br></div><div>&nbsp; &nbsp; &nbsp; &nbsp; disk {</div><div>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; on-io-error detach;</div><div>&nbsp; &nbsp; &nbsp; &nbsp; }</div><div><br></div><div>&nbsp; &nbsp; &nbsp; &nbsp; net {</div><div>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; cram-hmac-alg sha1;</div><div>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; shared-secret "UcfGroup";</div><div>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; data-integrity-alg sha1;</div><div>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; after-sb-0pri disconnect;</div><div>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; after-sb-1pri disconnect;</div><div>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; after-sb-2pri disconnect;</div><div>&nbsp; &nbsp; &nbsp; &nbsp;}</div><div>&nbsp; &nbsp; &nbsp; &nbsp;syncer {</div><div>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; #on-no-data-accessible io-error;</div><div>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; #verify-alg sha1;</div><div>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; rate 1000M;</div><div>&nbsp; &nbsp; &nbsp; &nbsp;}</div><div>}</div></div></div><div style="line-height: 21px;"><br></div><div style="line-height: 21px;"><br></div><div style="line-height: 21px;">-----------------------next is the &nbsp;bond information-----</div><div style="line-height: 21px;"><br></div><div style="line-height: 21px;"><div>[root@mysql03 bonding]# cat bond0</div><div>Ethernet Channel Bonding Driver: v3.6.0 (September 26, 2009)</div><div><br></div><div>Bonding Mode: fault-tolerance (active-backup)</div><div>Primary Slave: None</div><div>Currently Active Slave: eth0</div><div>MII Status: up</div><div>MII Polling Interval (ms): 100</div><div>Up Delay (ms): 0</div><div>Down Delay (ms): 0</div><div><br></div><div>Slave Interface: eth0</div><div>MII Status: up</div><div>Speed: 1000 Mbps</div><div>Duplex: full</div><div>Link Failure Count: 0</div><div>Permanent HW addr: ac:16:2d:88:28:08</div><div>Slave queue ID: 0</div><div><br></div><div>Slave Interface: eth4</div><div>MII Status: up</div><div>Speed: 1000 Mbps</div><div>Duplex: full</div><div>Link Failure Count: 0</div><div>Permanent HW addr: f4:ce:46:a5:81:94</div><div>Slave queue ID: 0</div></div><div style="line-height: 21px;"><br></div><div style="line-height: 21px;">------------------------------------------</div><div style="line-height: 21px;"><span style="line-height: 1.5;"><br></span></div><div style="line-height: 21px;"><span style="line-height: 1.5;"><br></span></div><div style="line-height: 21px;"><span style="line-height: 1.5;"><div>10: bond0: &lt;BROADCAST,MULTICAST,MASTER,UP,LOWER_UP&gt; mtu 1500 qdisc noqueue state UP</div><div>&nbsp; &nbsp; link/ether ac:16:2d:88:28:08 brd ff:ff:ff:ff:ff:ff</div><div>&nbsp; &nbsp; inet 10.10.10.70/24 brd 10.10.10.255 scope global bond0</div><div>&nbsp; &nbsp; inet 10.10.10.100/24 brd 10.10.10.255 scope global secondary bond0</div><div>&nbsp; &nbsp; inet6 fe80::ae16:2dff:fe88:2808/64 scope link</div><div>&nbsp; &nbsp; &nbsp; &nbsp;valid_lft forever preferred_lft forever</div></span></div><div style="line-height: 21px;"><span style="line-height: 1.5;"><br></span></div><div style="line-height: 21px;"><span style="line-height: 1.5;"><br></span></div><div style="line-height: 21px;">--------------------------------------release info--------------------------------------------------</div><div style="line-height: 21px;"><br></div><div style="line-height: 21px;"><div>[root@mysql03 bonding]# uname -a</div><div>Linux mysql03 2.6.32-431.5.1.el6.x86_64 #1 SMP Wed Feb 12 00:41:43 UTC 2014 x86_64 x86_64 x86_64 GNU/Linux</div><div>[root@mysql03 bonding]# drbdadm -V</div><div>DRBDADM_BUILDTAG=GIT-hash:\ 599f286440bd633d15d5ff985204aff4bccffadd\ build\ by\ mockbuild@Build64R6\,\ 2013-10-25\ 09:52:00</div><div>DRBDADM_API_VERSION=1</div><div>DRBD_KERNEL_VERSION_CODE=0x080404</div><div>DRBDADM_VERSION_CODE=0x080404</div><div>DRBDADM_VERSION=8.4.4</div></div><div style="line-height: 21px;"><br></div><div style="line-height: 21px;">-------------------------------------------------------------</div><div style="line-height: 21px;">so ,i am so appreciate &nbsp;if you can give me so clue to solve the problem,if you want more information about our config ,just let me know, 3q</div><div style="line-height: 21px;"><br></div><div style="line-height: 21px;">waiting online ~~~</div><div style="line-height: 21px;">&nbsp;</div><div style="line-height: 21px;"><br></div><div style="line-height: 21px;"><br></div><div style="line-height: 21px;"><span style="line-height: 1.5;"><br></span></div><div style="line-height: 21px;"><span style="line-height: 1.5;"><br></span></div><div style="line-height: 21px;"><span style="line-height: 1.5;"><br></span></div><div style="line-height: 21px;"><span style="line-height: 1.5;"><br></span></div><div style="line-height: 21px;"><span style="line-height: 1.5;"><br></span></div><div style="line-height: 21px;"><span style="line-height: 1.5;">&nbsp;</span></div></div>