Hello<br>I am using drbd 0.7.21 &amp; it got stuck in broken pipe state . Looks like drbd worker thread is not able to exit . Please suggest what should I do ? <br><br>Syslog at Primary Node:<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: Handshake successful: DRBD Network Protocol version 74<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: Connection established.<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: I am(P): 1:00000002:00000001:00000005:00000004:10<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: Peer(S): 1:00000002:00000001:00000004:00000004:00<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: drbd0_receiver [16730]: cstate WFReportParams --&gt; WFBitMapS<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: Primary/Unknown --&gt; Primary/Secondary<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: drbd0_receiver [16730]: cstate WFBitMapS --&gt; SyncSource<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: Resync started as SyncSource (need to sync 16 KB [4 bits set]).<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: Resync done (total 1 sec; paused 0 sec; 16 K/sec)<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: drbd0_worker [24592]: cstate SyncSource --&gt; Connected<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:22 kernel: drbd1: drbd1_receiver [16738]: cstate WFConnection --&gt; WFReportParams<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:22 kernel: drbd1: Handshake successful: DRBD Network Protocol version 74<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:22 kernel: drbd1: Connection established.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:22 kernel: drbd1: I am(P): 1:00000002:00000001:00000006:00000002:10<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:22 kernel: drbd1: Peer(S): 1:00000002:00000001:00000005:00000002:00<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:22 kernel: drbd1: drbd1_receiver [16738]: cstate WFReportParams --&gt; WFBitMapS<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:22 kernel: drbd1: Primary/Unknown --&gt; Primary/Secondary<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:22 kernel: drbd1: drbd1_receiver [16738]: cstate WFBitMapS --&gt; SyncSource<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:22 kernel: drbd1: Resync started as SyncSource (need to sync 1488 KB [372 bits set]).<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:22 kernel: drbd1: Resync done (total 1 sec; paused 0 sec; 1488 K/sec)<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:22 kernel: drbd1: drbd1_worker [24593]: cstate SyncSource --&gt; Connected<br>&nbsp;<br>Note : Here Secondary gone for reboot :<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: sock was shut down by peer<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: drbd0_receiver [16730]: cstate Connected --&gt; BrokenPipe<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: short read expecting header on sock: r=0<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: meta connection shut down by peer.<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: worker terminated<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: asender terminated<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: drbd0_receiver [16730]: cstate BrokenPipe --&gt; Unconnected<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: Connection lost.<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: drbd0_receiver [16730]: cstate Unconnected --&gt; WFConnection<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: sock was reset by peer<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: meta connection shut down by peer.<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: sock_sendmsg returned -32<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: drbd1_receiver [16738]: cstate Connected --&gt; BrokenPipe<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: short read expecting header on sock: r=-104<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: asender terminated<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: drbd1_worker [24593]: cstate BrokenPipe --&gt; BrokenPipe<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: short sent UnplugRemote size=8 sent=0<br><br>Syslog at Secondary Node:<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: Handshake successful: DRBD Network Protocol version 74<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: Connection established.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: I am(S): 1:00000002:00000001:00000004:00000004:00<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: Peer(P): 1:00000002:00000001:00000005:00000004:10<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: drbd0_receiver [16754]: cstate WFReportParams --&gt; WFBitMapT<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: Secondary/Unknown --&gt; Secondary/Primary<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: drbd0_receiver [16754]: cstate WFBitMapT --&gt; SyncTarget<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: Resync started as SyncTarget (need to sync 16 KB [4 bits set]).<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: Resync done (total 1 sec; paused 0 sec; 16 K/sec)<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:21 kernel: drbd0: drbd0_worker [16732]: cstate SyncTarget --&gt; Connected<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:22 kernel: drbd1: drbd1_receiver [16762]: cstate WFConnection --&gt; WFReportParams<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:22 kernel: drbd1: Handshake successful: DRBD Network Protocol version 74<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:22 kernel: drbd1: Connection established.<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:22 kernel: drbd1: I am(S): 1:00000002:00000001:00000005:00000002:00<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:22 kernel: drbd1: Peer(P): 1:00000002:00000001:00000006:00000002:10<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:22 kernel: drbd1: drbd1_receiver [16762]: cstate WFReportParams --&gt; WFBitMapT<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:29:22 kernel: drbd1: Secondary/Unknown --&gt; Secondary/Primary<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <br>Note : Now system is going for reboot:<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: drbdsetup [2393]: cstate Connected --&gt; Unconnected<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: drbd0_receiver [16754]: cstate Unconnected --&gt; BrokenPipe<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: short read expecting header on sock: r=-512<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: worker terminated<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: asender terminated<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: drbd0_receiver [16754]: cstate BrokenPipe --&gt; StandAlone<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: Connection lost.<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: receiver terminated<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: drbdsetup [2393]: cstate StandAlone --&gt; StandAlone<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: drbdsetup [2393]: cstate StandAlone --&gt; Unconfigured<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd0: worker terminated<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: drbdsetup [2398]: cstate Connected --&gt; Unconnected<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: drbd1_receiver [16762]: cstate Unconnected --&gt; BrokenPipe<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: short read expecting header on sock: r=-512<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: worker terminated<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: asender terminated<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: drbd1_receiver [16762]: cstate BrokenPipe --&gt; StandAlone<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: Connection lost.<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: receiver terminated<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: drbdsetup [2398]: cstate StandAlone --&gt; StandAlone<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: drbdsetup [2398]: cstate StandAlone --&gt; Unconfigured<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Dec 12 19:55:14 kernel: drbd1: worker terminated<br><br><br>Any valuable input will be helpful.<br><br>Thanks in advance.<br><br>Regards,<br>Anil <br><br>