Hi,<br><br>can you help me with this? I can&#39;t figure it out why it goes &quot;StandAlone&quot;.<br><br>Regards,<br>Pedro Sousa<br><br><div class="gmail_quote">On Thu, May 28, 2009 at 6:49 PM, Pedro Sousa <span dir="ltr">&lt;<a href="mailto:pgsousa@gmail.com">pgsousa@gmail.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">Can you check it please?<br><br>May 27 19:38:35 ha2 heartbeat: [2426]: ERROR: glib: Unable to send bcast [-1] packet(len=217): No such device<br>
May 27 19:38:35 ha2 heartbeat: [2426]: ERROR: write_child: write failure on bcast eth1.: No such device<br>
May 27 19:38:37 ha2 heartbeat: [2426]: ERROR: glib: Unable to send bcast [-1] packet(len=217): No such device<br>May 27 19:38:37 ha2 heartbeat: [2426]: ERROR: write_child: write failure on bcast eth1.: No such device<br>
May 27 19:38:38 ha2 kernel: drbd0: PingAck did not arrive in time.<br>
May 27 19:38:38 ha2 kernel: drbd0: peer( Primary -&gt; Unknown ) conn( Connected -&gt; NetworkFailure ) pdsk( UpToDate -&gt; DUnknown ) <br>May 27 19:38:38 ha2 kernel: drbd0: asender terminated<br>May 27 19:38:38 ha2 kernel: drbd0: Terminating asender thread<br>

May 27 19:38:38 ha2 kernel: drbd0: short read expecting header on sock: r=-512<br>May 27 19:38:38 ha2 kernel: drbd0: Writing meta data super block now.<br>May 27 19:38:38 ha2 kernel: drbd0: tl_clear()<br>May 27 19:38:38 ha2 kernel: drbd0: Connection closed<br>

May 27 19:38:38 ha2 kernel: drbd0: conn( NetworkFailure -&gt; Unconnected ) <br>May 27 19:38:38 ha2 kernel: drbd0: receiver terminated<br>May 27 19:38:38 ha2 kernel: drbd0: receiver (re)started<br>May 27 19:38:38 ha2 kernel: drbd0: conn( Unconnected -&gt; WFConnection ) <br>

May 27 19:38:38 ha2 kernel: drbd0: Unable to bind source sock (-99)<br>May 27 19:38:38 ha2 last message repeated 2 times<br>May 27 19:38:38 ha2 kernel: drbd0: Unable to bind sock2 (-99)<br>May 27 19:38:38 ha2 kernel: drbd0: conn( WFConnection -&gt; Disconnecting ) <br>

May 27 19:38:38 ha2 kernel: drbd0: Discarding network configuration.<br>May 27 19:38:38 ha2 kernel: drbd0: tl_clear()<br>May 27 19:38:38 ha2 kernel: drbd0: Connection closed<br>May 27 19:38:38 ha2 kernel: drbd0: conn( Disconnecting -&gt; StandAlone ) <br>

May 27 19:38:38 ha2 kernel: drbd0: receiver terminated<br>May 27 19:38:38 ha2 kernel: drbd0: Terminating receiver thread<br>May 27 19:38:39 ha2 heartbeat: [2426]: ERROR: glib: Unable to send bcast [-1] packet(len=217): No such device<br>

May 27 19:38:39 ha2 heartbeat: [2426]: ERROR: write_child: write failure on bcast eth1.: No such device<br>May 27 19:38:40 ha2 kernel: drbd0: disk( UpToDate -&gt; Outdated ) <br>May 27 19:38:40 ha2 kernel: drbd0: Writing meta data super block now.<br>

May 27 19:38:40 ha2 /usr/lib/heartbeat/dopd: [2513]: info: sending return code: 4, ha2.teste.local -&gt; ha1.teste.local <br>May 27 19:38:41 ha2 heartbeat: [2426]: ERROR: glib: Unable to send bcast [-1] packet(len=310): No such device<br>

May 27 19:38:41 ha2 heartbeat: [2426]: ERROR: write_child: write failure on bcast eth1.: No such device<br>May 27 19:38:41 ha2 heartbeat: [2426]: ERROR: glib: Unable to send bcast [-1] packet(len=217): No such device<br>
May 27 19:38:41 ha2 heartbeat: [2426]: ERROR: write_child: write failure on bcast eth1.: No such device<br>
May 27 19:38:43 ha2 heartbeat: [2426]: ERROR: glib: Unable to send bcast [-1] packet(len=217): No such device<br>May 27 19:38:43 ha2 heartbeat: [2426]: ERROR: write_child: write failure on bcast eth1.: No such device<br>
May 27 19:38:45 ha2 heartbeat: [2408]: info: Link ha1.teste.local:eth1 dead.<br>
May 27 19:38:45 ha2 ipfail: [2514]: info: Link Status update: Link ha1.teste.local/eth1 now has status dead<br>May 27 19:38:45 ha2 heartbeat: [2426]: ERROR: glib: Unable to send bcast [-1] packet(len=217): No such device<br>

May 27 19:38:45 ha2 heartbeat: [2426]: ERROR: write_child: write failure on bcast eth1.: No such device<br>May 27 19:38:46 ha2 ipfail: [2514]: info: Asking other side for ping node count.<br>May 27 19:38:46 ha2 ipfail: [2514]: info: Checking remote count of ping nodes.<br>

May 27 19:38:46 ha2 heartbeat: [2426]: ERROR: glib: Unable to send bcast [-1] packet(len=223): No such device<br>May 27 19:38:46 ha2 heartbeat: [2426]: ERROR: write_child: write failure on bcast eth1.: No such device<br>
May 27 19:38:46 ha2 heartbeat: [2426]: WARN: Temporarily Suppressing write error messages<br>
May 27 19:38:46 ha2 heartbeat: [2426]: WARN: Is a cable unplugged on bcast eth1?<br>May 27 19:38:47 ha2 ipfail: [2514]: info: Ping node count is balanced.<br>May 27 19:38:48 ha2 ipfail: [2514]: info: No giveup timer to abort.<br>

May 27 19:39:06 ha2 kernel: eth1: link up<br><br>Regards,<br><font color="#888888">Pedro Sousa</font><div><div></div><div class="h5"><br><br><br><br><div class="gmail_quote">On Thu, May 28, 2009 at 4:51 PM, Lars Ellenberg <span dir="ltr">&lt;<a href="mailto:lars.ellenberg@linbit.com" target="_blank">lars.ellenberg@linbit.com</a>&gt;</span> wrote:<br>

<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div>On Thu, May 28, 2009 at 01:46:43PM +0100, Pedro Sousa wrote:<br>
&gt; Hi,<br>
&gt;<br>
&gt; I&#39;m testing split-brain in a master/slave scenario with dopd and have some<br>
&gt; doubts about the automatic recovery procedure. The steps I took were:<br>
&gt;<br>
&gt; 1º Unplug the crossover cable<br>
&gt;<br>
&gt; Master:<br>
&gt;<br>
&gt; Primary/Unknown ds:UpToDate/Outdated<br>
&gt;<br>
&gt; Slave:<br>
&gt;<br>
&gt; StandAlone ro:Secondary/Unknown ds:Consistent/DUnknown<br>
&gt;<br>
&gt; 2º Plug the cable back on:<br>
&gt;<br>
&gt; Both nodes remain with the same state: Update/Outdated and<br>
&gt; Consistent/Unknown<br>
&gt;<br>
&gt; My question is: shouldn&#39;t the slave rejoin/resync to the master<br>
&gt; automatically after I plug the cable?<br>
&gt;<br>
&gt; I have to manually  run: &quot;drbdadm adjust all&quot; to recover it.<br>
<br>
</div>once a node reaches &quot;StandAlone&quot;,<br>
you have to tell it to try and reconnect, yes.<br>
<br>
so this is how it is supposed to be.<br>
<br>
why it goes to &quot;StandAlone&quot; should be in the logs.<br>
<div><br>
&gt; My conf (centos 5.3; drbd 8.3.1; heartbeat 2.99)<br>
&gt;<br>
&gt; /etc/drbd.conf<br>
<br>
</div>&lt;/snip&gt;<br>
<br>
<br>
--<br>
: Lars Ellenberg<br>
: LINBIT | Your Way to High Availability<br>
: DRBD/HA support and consulting <a href="http://www.linbit.com" target="_blank">http://www.linbit.com</a><br>
<br>
DRBD® and LINBIT® are registered trademarks of LINBIT, Austria.<br>
__<br>
please don&#39;t Cc me, but send to list   --   I&#39;m subscribed<br>
_______________________________________________<br>
drbd-user mailing list<br>
<a href="mailto:drbd-user@lists.linbit.com" target="_blank">drbd-user@lists.linbit.com</a><br>
<a href="http://lists.linbit.com/mailman/listinfo/drbd-user" target="_blank">http://lists.linbit.com/mailman/listinfo/drbd-user</a><br>
</blockquote></div><br>
</div></div></blockquote></div><br>