<P>
What can cause DRBD to enter and remain stuck in NetworkFailure state?<BR>
We're using 0.7.21 and kernel 2.6.10. There're a lot of error messages in syslog of the<BR>
Primary DRBD and finally got stuck in NetworkFailure state. All this<BR>
happened when FullSync started. Found that network link was okay.<BR>
Many messages in Primary syslog like these:<BR>
<BR>
kernel: drbd0: Primary/Unknown --&gt; Primary/Secondary<BR>
kernel: drbd0: drbd0_receiver [3182]: cstate WFBitMapS --&gt; SyncSource<BR>
kernel: drbd0: Resync started as SyncSource (need to sync 4848340 KB [1212085 bits set]).<BR>
kernel: drbd0: drivers/block/drbd/drbd_main.c:1095: SyncSource flags=0x2020a<BR>
kernel: drbd0: kjournald [3269]: cstate SyncSource --&gt; NetworkFailure<BR>
<BR>
Another time found this,<BR>
<BR>
kernel: drbd0: pdflush [91]: cstate SyncSource --&gt; NetworkFailure<BR>
kernel: drbd0: drbd_send_block() failed<BR>
kernel: drbd0: drbd0_receiver [3182]: cstate NetworkFailure --&gt; BrokenPipe<BR>
<BR>
Observed this on the Secondary DRBD syslog sometimes when Primary was<BR>
going in to and coming out of NetworkFailure state:<BR>
kernel: drbd0: Avoided requeue of resync_work<BR>
<BR>
Can somebody tell me what can cause all this and what's the way out when DRBD gets stuck like this? Thanks.<BR>
<BR>
VG
</P>
<br><br>
<a href="http://adworks.rediff.com/cgi-bin/AdWorks/sigclick.cgi/www.rediff.com/signature-home.htm/1507191490@Middle5?PARTNER=3"><IMG SRC="http://adworks.rediff.com/cgi-bin/AdWorks/sigimpress.cgi/www.rediff.com/signature-home.htm/1963059423@Middle5?OAS_query=null&PARTNER=3" BORDER=0 VSPACE=0 HSPACE=0></a>