<span class="gmail_quote">2007/6/11, N.J. van der Horn (Nico) &lt;<a href="mailto:nico@vanderhorn.nl">nico@vanderhorn.nl</a>&gt;:</span><blockquote class="gmail_quote" style="margin-top: 0; margin-right: 0; margin-bottom: 0; margin-left: 0; margin-left: 0.80ex; border-left-color: #cccccc; border-left-width: 1px; border-left-style: solid; padding-left: 1ex">
Hallo DRBD-meisters und lovers !<br><br>As far as i am aware of, i never had any real<br>problems using DRBD, but that changed a couple of days ago.<br>Both nodes suddenly have status &quot;StandAlone&quot; and<br>&quot;messages&quot; shows that i am blessed with &quot;Split-Brain&quot;.
<br><br>I suspect myself forgotting to change the state<br>of node foc1 to Secondary before starting Heartbeat.<br>There is no other clue coming up into my mind to<br>explain what caused this situation.... grinzz<br><br>On both nodes fsck is happy, even with &quot;fsck -n&quot;
<br>(readonly) on the physical device after stopping DRBD.<br>I can mount (did that 1-at-a-time) both sides and<br>my data looks about the same (no real comparison made).<br><br>The cluster is a test-setup in my lab, the data
<br>has no real value, but i like to understand what&#39;s wrong.<br><br>Thanks in advance for your valued answers.<br><br>Nico van der Horn<br><br><br>Questions:<br>----------<br>1. how can i determine the real cause of the split-brain ?
</blockquote><div><br>Split-Brains&nbsp;are&nbsp;mainly&nbsp;caused&nbsp;by&nbsp;a&nbsp;loss&nbsp;of&nbsp;communication&nbsp;between&nbsp;the&nbsp;two&nbsp;nodes, and the Secondary node becoming Primary, while the other node remains in Primary state (both nodes think their peer is dead, so they become both Primary).
<br><br>Check&nbsp;your&nbsp;syslog&nbsp;to&nbsp;see&nbsp;what&nbsp;happened&nbsp;before&nbsp;the&nbsp;Split-Brain&nbsp;occurred&nbsp;(eth0&nbsp;link&nbsp;down,&nbsp;etc.)</div><br><blockquote class="gmail_quote" style="margin-top: 0; margin-right: 0; margin-bottom: 0; margin-left: 0; margin-left: 0.80ex; border-left-color: #cccccc; border-left-width: 1px; border-left-style: solid; padding-left: 1ex">
2. how to correct the situation ?</blockquote><div><br>You&nbsp;have&nbsp;to&nbsp;decide&nbsp;which&nbsp;node&nbsp;you&nbsp;want&nbsp;to&nbsp;&quot;sacrifice&quot;,&nbsp;and&nbsp;tell him to discard&nbsp;his&nbsp;data.<br><br>Run the following command on the node on which you want to discard the data :
<br><br>&nbsp;&nbsp;&nbsp;&nbsp;root@bad-data# drbdadm -- --discard-my-data connect all<br><br>Then, simply connect the other&nbsp;machine&nbsp;: <br><br>&nbsp;&nbsp;&nbsp;&nbsp;root@good-data#&nbsp;drbdadm&nbsp;connect&nbsp;all</div><br>The nodes will start to resynchronize,&nbsp;transferring&nbsp;data&nbsp;from&nbsp;the good-data node (will&nbsp;appears&nbsp;as SyncSource in /proc/drbd) to the bad-data node (SyncTarget).
<br><br>Regards,<br>Jérôme Augé<br>