<div>Hi Pedro,</div>
<div> </div>
<div>sorry, I am not following the thread from the beginning. But we can see from the log excerpt that your eth1 NIC has disapeared for half a minute. You should check the whole log file for what was happening at that time. Could it be a network service restart?</div>

<div>As Lars already answered you, once DRBD resource went StandAlone, you have to reconnect it manually. There are some properties available in drbd.conf that defines the time period or number of attempts after which it gaves up trying to reconnect.<br>
</div>
<div>Tino<br></div>
<div class="gmail_quote">2009/6/3 Pedro Sousa <span dir="ltr">&lt;<a href="mailto:pgsousa@gmail.com">pgsousa@gmail.com</a>&gt;</span><br>
<blockquote style="BORDER-LEFT: #ccc 1px solid; MARGIN: 0px 0px 0px 0.8ex; PADDING-LEFT: 1ex" class="gmail_quote">Hi,<br><br>can you help me with this? I can&#39;t figure it out why it goes &quot;StandAlone&quot;.<br><br>
Regards,<br>Pedro Sousa<br><br>
<div class="gmail_quote">On Thu, May 28, 2009 at 6:49 PM, Pedro Sousa <span dir="ltr">&lt;<a href="mailto:pgsousa@gmail.com" target="_blank">pgsousa@gmail.com</a>&gt;</span> wrote:<br>
<blockquote style="BORDER-LEFT: rgb(204,204,204) 1px solid; MARGIN: 0pt 0pt 0pt 0.8ex; PADDING-LEFT: 1ex" class="gmail_quote">Can you check it please?<br><br>May 27 19:38:35 ha2 heartbeat: [2426]: ERROR: glib: Unable to send bcast [-1] packet(len=217): No such device<br>
May 27 19:38:35 ha2 heartbeat: [2426]: ERROR: write_child: write failure on bcast eth1.: No such device<br>May 27 19:38:37 ha2 heartbeat: [2426]: ERROR: glib: Unable to send bcast [-1] packet(len=217): No such device<br>May 27 19:38:37 ha2 heartbeat: [2426]: ERROR: write_child: write failure on bcast eth1.: No such device<br>
May 27 19:38:38 ha2 kernel: drbd0: PingAck did not arrive in time.<br>May 27 19:38:38 ha2 kernel: drbd0: peer( Primary -&gt; Unknown ) conn( Connected -&gt; NetworkFailure ) pdsk( UpToDate -&gt; DUnknown ) <br>May 27 19:38:38 ha2 kernel: drbd0: asender terminated<br>
May 27 19:38:38 ha2 kernel: drbd0: Terminating asender thread<br>May 27 19:38:38 ha2 kernel: drbd0: short read expecting header on sock: r=-512<br>May 27 19:38:38 ha2 kernel: drbd0: Writing meta data super block now.<br>May 27 19:38:38 ha2 kernel: drbd0: tl_clear()<br>
May 27 19:38:38 ha2 kernel: drbd0: Connection closed<br>May 27 19:38:38 ha2 kernel: drbd0: conn( NetworkFailure -&gt; Unconnected ) <br>May 27 19:38:38 ha2 kernel: drbd0: receiver terminated<br>May 27 19:38:38 ha2 kernel: drbd0: receiver (re)started<br>
May 27 19:38:38 ha2 kernel: drbd0: conn( Unconnected -&gt; WFConnection ) <br>May 27 19:38:38 ha2 kernel: drbd0: Unable to bind source sock (-99)<br>May 27 19:38:38 ha2 last message repeated 2 times<br>May 27 19:38:38 ha2 kernel: drbd0: Unable to bind sock2 (-99)<br>
May 27 19:38:38 ha2 kernel: drbd0: conn( WFConnection -&gt; Disconnecting ) <br>May 27 19:38:38 ha2 kernel: drbd0: Discarding network configuration.<br>May 27 19:38:38 ha2 kernel: drbd0: tl_clear()<br>May 27 19:38:38 ha2 kernel: drbd0: Connection closed<br>
May 27 19:38:38 ha2 kernel: drbd0: conn( Disconnecting -&gt; StandAlone ) <br>May 27 19:38:38 ha2 kernel: drbd0: receiver terminated<br>May 27 19:38:38 ha2 kernel: drbd0: Terminating receiver thread<br>May 27 19:38:39 ha2 heartbeat: [2426]: ERROR: glib: Unable to send bcast [-1] packet(len=217): No such device<br>
May 27 19:38:39 ha2 heartbeat: [2426]: ERROR: write_child: write failure on bcast eth1.: No such device<br>May 27 19:38:40 ha2 kernel: drbd0: disk( UpToDate -&gt; Outdated ) <br>May 27 19:38:40 ha2 kernel: drbd0: Writing meta data super block now.<br>
May 27 19:38:40 ha2 /usr/lib/heartbeat/dopd: [2513]: info: sending return code: 4, ha2.teste.local -&gt; ha1.teste.local <br>May 27 19:38:41 ha2 heartbeat: [2426]: ERROR: glib: Unable to send bcast [-1] packet(len=310): No such device<br>
May 27 19:38:41 ha2 heartbeat: [2426]: ERROR: write_child: write failure on bcast eth1.: No such device<br>May 27 19:38:41 ha2 heartbeat: [2426]: ERROR: glib: Unable to send bcast [-1] packet(len=217): No such device<br>May 27 19:38:41 ha2 heartbeat: [2426]: ERROR: write_child: write failure on bcast eth1.: No such device<br>
May 27 19:38:43 ha2 heartbeat: [2426]: ERROR: glib: Unable to send bcast [-1] packet(len=217): No such device<br>May 27 19:38:43 ha2 heartbeat: [2426]: ERROR: write_child: write failure on bcast eth1.: No such device<br>May 27 19:38:45 ha2 heartbeat: [2408]: info: Link ha1.teste.local:eth1 dead.<br>
May 27 19:38:45 ha2 ipfail: [2514]: info: Link Status update: Link ha1.teste.local/eth1 now has status dead<br>May 27 19:38:45 ha2 heartbeat: [2426]: ERROR: glib: Unable to send bcast [-1] packet(len=217): No such device<br>
May 27 19:38:45 ha2 heartbeat: [2426]: ERROR: write_child: write failure on bcast eth1.: No such device<br>May 27 19:38:46 ha2 ipfail: [2514]: info: Asking other side for ping node count.<br>May 27 19:38:46 ha2 ipfail: [2514]: info: Checking remote count of ping nodes.<br>
May 27 19:38:46 ha2 heartbeat: [2426]: ERROR: glib: Unable to send bcast [-1] packet(len=223): No such device<br>May 27 19:38:46 ha2 heartbeat: [2426]: ERROR: write_child: write failure on bcast eth1.: No such device<br>May 27 19:38:46 ha2 heartbeat: [2426]: WARN: Temporarily Suppressing write error messages<br>
May 27 19:38:46 ha2 heartbeat: [2426]: WARN: Is a cable unplugged on bcast eth1?<br>May 27 19:38:47 ha2 ipfail: [2514]: info: Ping node count is balanced.<br>May 27 19:38:48 ha2 ipfail: [2514]: info: No giveup timer to abort.<br>
May 27 19:39:06 ha2 kernel: eth1: link up<br><br>Regards,<br><font color="#888888">Pedro Sousa</font> 
<div>
<div></div>
<div><br><br><br><br>
<div class="gmail_quote">On Thu, May 28, 2009 at 4:51 PM, Lars Ellenberg <span dir="ltr">&lt;<a href="mailto:lars.ellenberg@linbit.com" target="_blank">lars.ellenberg@linbit.com</a>&gt;</span> wrote:<br>
<blockquote style="BORDER-LEFT: rgb(204,204,204) 1px solid; MARGIN: 0pt 0pt 0pt 0.8ex; PADDING-LEFT: 1ex" class="gmail_quote">
<div>On Thu, May 28, 2009 at 01:46:43PM +0100, Pedro Sousa wrote:<br>&gt; Hi,<br>&gt;<br>&gt; I&#39;m testing split-brain in a master/slave scenario with dopd and have some<br>&gt; doubts about the automatic recovery procedure. The steps I took were:<br>
&gt;<br>&gt; 1º Unplug the crossover cable<br>&gt;<br>&gt; Master:<br>&gt;<br>&gt; Primary/Unknown ds:UpToDate/Outdated<br>&gt;<br>&gt; Slave:<br>&gt;<br>&gt; StandAlone ro:Secondary/Unknown ds:Consistent/DUnknown<br>&gt;<br>
&gt; 2º Plug the cable back on:<br>&gt;<br>&gt; Both nodes remain with the same state: Update/Outdated and<br>&gt; Consistent/Unknown<br>&gt;<br>&gt; My question is: shouldn&#39;t the slave rejoin/resync to the master<br>
&gt; automatically after I plug the cable?<br>&gt;<br>&gt; I have to manually  run: &quot;drbdadm adjust all&quot; to recover it.<br><br></div>once a node reaches &quot;StandAlone&quot;,<br>you have to tell it to try and reconnect, yes.<br>
<br>so this is how it is supposed to be.<br><br>why it goes to &quot;StandAlone&quot; should be in the logs.<br>
<div><br>&gt; My conf (centos 5.3; drbd 8.3.1; heartbeat 2.99)<br>&gt;<br>&gt; /etc/drbd.conf<br><br></div>&lt;/snip&gt;<br><br><br>--<br>: Lars Ellenberg<br>: LINBIT | Your Way to High Availability<br>: DRBD/HA support and consulting <a href="http://www.linbit.com/" target="_blank">http://www.linbit.com</a><br>
<br>DRBD® and LINBIT® are registered trademarks of LINBIT, Austria.<br>__<br>please don&#39;t Cc me, but send to list   --   I&#39;m subscribed<br>_______________________________________________<br>drbd-user mailing list<br>
<a href="mailto:drbd-user@lists.linbit.com" target="_blank">drbd-user@lists.linbit.com</a><br><a href="http://lists.linbit.com/mailman/listinfo/drbd-user" target="_blank">http://lists.linbit.com/mailman/listinfo/drbd-user</a><br>
</blockquote></div><br></div></div></blockquote></div><br><br>_______________________________________________<br>drbd-user mailing list<br><a href="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</a><br><a href="http://lists.linbit.com/mailman/listinfo/drbd-user" target="_blank">http://lists.linbit.com/mailman/listinfo/drbd-user</a><br>
<br></blockquote></div><br>