<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 TRANSITIONAL//EN">
<HTML>
<HEAD>
  <META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=UTF-8">
  <META NAME="GENERATOR" CONTENT="GtkHTML/3.12.0">
</HEAD>
<BODY>
Does anyone know what could cause the two drbd processes to not connect? I managed to get a reboot in on the other server, and still they are not connecting and synching. The drbd mirrored pair has been down almost 16 hours now.<BR>
<BR>
Doug<BR>
<BR>
On Thu, 2007-05-03 at 16:08 -0400, Doug Knight wrote:<BR>
<BLOCKQUOTE TYPE=CITE>
    <FONT COLOR="#000000">Note, if I change the order in which I execute bringing up drbd (drbdadm down on both nodes, then bring up node2 first), then the cs status is reversed (node1 is standalone and node2 is wfconnection).</FONT><BR>
    <BR>
    <FONT COLOR="#000000">Doug</FONT><BR>
    <FONT COLOR="#000000">WSI, Inc.</FONT><BR>
    <FONT COLOR="#000000">On Thu, 2007-05-03 at 16:03 -0400, Doug Knight wrote:</FONT><BR>
    <BLOCKQUOTE TYPE=CITE>
        <FONT COLOR="#000000">I'm not sure where to start on this one. I've been working with drbd and heartbeat, trying to track down an issue where one of the two nodes doesn't fail over resources correctly when heartbeat is shutdown. I uncovered that at some point drbd stopped talking across my dedicated network link, and even manually I cannot get the two nodes to see each other through drbd. Pings across the network link work fine in both directions. I have completely unloaded and reloaded the drbd modules from the kernel, which had corrected this issue the last time I saw it, but it didn't correct it this time. I've rebooted one of the nodes, but I'm not in a position where I can reboot the other yet (other activity on the other node requires scheduling the reboot). Can someone point me down a troubleshooting road to determine why drbd doesn't reconnect? Here's how the /proc/drbd files look after I've done the usual (modprobe drbd; service drbd start;) set of commands:</FONT><BR>
        <BR>
        <FONT COLOR="#000000">Node1</FONT><BR>
        <TT><FONT COLOR="#000000">[root@arc-dknightlx ~]# modprobe drbd</FONT></TT><BR>
        <TT><FONT COLOR="#000000">[root@arc-dknightlx ~]# service drbd start</FONT></TT><BR>
        <TT><FONT COLOR="#000000">Starting DRBD resources:&nbsp;&nbsp;&nbsp; [ d0 s0 n0 ].</FONT></TT><BR>
        <TT><FONT COLOR="#000000">..........</FONT></TT><BR>
        <TT><FONT COLOR="#000000">***************************************************************</FONT></TT><BR>
        <TT><FONT COLOR="#000000">DRBD's startup script waits for the peer node(s) to appear.</FONT></TT><BR>
        <TT><FONT COLOR="#000000">- In case this node was already a degraded cluster before the</FONT></TT><BR>
        <TT><FONT COLOR="#000000">&nbsp;&nbsp; reboot the timeout is 60 seconds. [degr-wfc-timeout]</FONT></TT><BR>
        <TT><FONT COLOR="#000000">- If the peer was available before the reboot the timeout will</FONT></TT><BR>
        <TT><FONT COLOR="#000000">&nbsp;&nbsp; expire after 0 seconds. [wfc-timeout]</FONT></TT><BR>
        <TT><FONT COLOR="#000000">&nbsp;&nbsp; (These values are for resource 'pgsql'; 0 sec -&gt; wait forever)</FONT></TT><BR>
        <TT><FONT COLOR="#000000">To abort waiting enter 'yes' [&nbsp; 12]:yes</FONT></TT><BR>
        <BR>
        <TT><FONT COLOR="#000000">[root@arc-dknightlx ~]# cat /proc/drbd</FONT></TT><BR>
        <TT><FONT COLOR="#000000">version: 8.0.1 (api:86/proto:86)</FONT></TT><BR>
        <TT><FONT COLOR="#000000">SVN Revision: 2784 build by root@arc-dknightlx, 2007-04-23 13:19:33</FONT></TT><BR>
        <TT><FONT COLOR="#000000">0: cs:WFConnection st:Secondary/Unknown ds:UpToDate/DUnknown C r---</FONT></TT><BR>
        <TT><FONT COLOR="#000000">&nbsp;&nbsp;&nbsp; ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0</FONT></TT><BR>
        <TT><FONT COLOR="#000000">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; resync: used:0/31 hits:0 misses:0 starving:0 dirty:0 changed:0</FONT></TT><BR>
        <TT><FONT COLOR="#000000">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; act_log: used:0/257 hits:0 misses:0 starving:0 dirty:0 changed:0</FONT></TT><BR>
        <BR>
        <BR>
        <FONT COLOR="#000000">Node2</FONT><BR>
        <TT><FONT COLOR="#000000">[root@arc-tkincaidlx log]# modprobe drbd</FONT></TT><BR>
        <TT><FONT COLOR="#000000">[root@arc-tkincaidlx log]# service drbd start</FONT></TT><BR>
        <TT><FONT COLOR="#000000">Starting DRBD resources:&nbsp;&nbsp;&nbsp; [ d0 s0 n0 ].</FONT></TT><BR>
        <TT><FONT COLOR="#000000">..........</FONT></TT><BR>
        <TT><FONT COLOR="#000000">***************************************************************</FONT></TT><BR>
        <TT><FONT COLOR="#000000">DRBD's startup script waits for the peer node(s) to appear.</FONT></TT><BR>
        <TT><FONT COLOR="#000000">- In case this node was already a degraded cluster before the</FONT></TT><BR>
        <TT><FONT COLOR="#000000">&nbsp;&nbsp; reboot the timeout is 60 seconds. [degr-wfc-timeout]</FONT></TT><BR>
        <TT><FONT COLOR="#000000">- If the peer was available before the reboot the timeout will</FONT></TT><BR>
        <TT><FONT COLOR="#000000">&nbsp;&nbsp; expire after 0 seconds. [wfc-timeout]</FONT></TT><BR>
        <TT><FONT COLOR="#000000">&nbsp;&nbsp; (These values are for resource 'pgsql'; 0 sec -&gt; wait forever)</FONT></TT><BR>
        <TT><FONT COLOR="#000000">To abort waiting enter 'yes' [&nbsp; 12]:yes</FONT></TT><BR>
        <BR>
        <TT><FONT COLOR="#000000">[root@arc-tkincaidlx log]# cat /proc/drbd</FONT></TT><BR>
        <TT><FONT COLOR="#000000">version: 8.0.1 (api:86/proto:86)</FONT></TT><BR>
        <TT><FONT COLOR="#000000">SVN Revision: 2784 build by root@arc-tkincaidlx.wsicorp.com, 2007-04-23 13:20:47</FONT></TT><BR>
        <TT><FONT COLOR="#000000">0: cs:StandAlone st:Secondary/Unknown ds:UpToDate/DUnknown&nbsp;&nbsp; r---</FONT></TT><BR>
        <TT><FONT COLOR="#000000">&nbsp;&nbsp;&nbsp; ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0</FONT></TT><BR>
        <TT><FONT COLOR="#000000">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; resync: used:0/31 hits:0 misses:0 starving:0 dirty:0 changed:0</FONT></TT><BR>
        <TT><FONT COLOR="#000000">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; act_log: used:0/257 hits:0 misses:0 starving:0 dirty:0 changed:0</FONT></TT><BR>
        <BR>
        <FONT COLOR="#000000">Any help would be greatly appreciated.  </FONT>
<PRE>
<FONT COLOR="#000000">_______________________________________________</FONT>
<FONT COLOR="#000000">drbd-user mailing list</FONT>
<FONT COLOR="#000000"><A HREF="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</A></FONT>
<FONT COLOR="#000000"><A HREF="http://lists.linbit.com/mailman/listinfo/drbd-user">http://lists.linbit.com/mailman/listinfo/drbd-user</A></FONT>
</PRE>
    </BLOCKQUOTE>
<PRE>
<FONT COLOR="#000000">_______________________________________________</FONT>
<FONT COLOR="#000000">drbd-user mailing list</FONT>
<FONT COLOR="#000000"><A HREF="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</A></FONT>
<FONT COLOR="#000000"><A HREF="http://lists.linbit.com/mailman/listinfo/drbd-user">http://lists.linbit.com/mailman/listinfo/drbd-user</A></FONT>
</PRE>
</BLOCKQUOTE>
</BODY>
</HTML>