<meta http-equiv="content-type" content="text/html; charset=utf-8"><span class="Apple-style-span" style="border-collapse: collapse; font-family: arial, sans-serif; font-size: 13px; ">Hi Lars, thanks for your response.<div>
<br></div><div>What I&#39;m trying to achieve is a load balanced MySQL cluster, where my application could write to both MYSQL servers, under DRBD.</div><div>I&#39;m actually using OCFS2 as the filesystem. But after several hours my nodes are always getting disconnected due to the failure I pointed out in the last message.</div>
<div><br></div><div>The reason I&#39;m running DRBD in dual primary mode, is that I expect to have MySQL writing on both nodes. Am I missing something?</div><div><br></div><div>What benefit would I have by running a Primary/Secondary configuration, instead of a Primary/Primary? </div>
<div><br></div></span>Regards,<br>Thiago Vinhas<br>
<br><br><div class="gmail_quote">On Fri, Jun 24, 2011 at 2:27 PM, Lars Ellenberg <span dir="ltr">&lt;<a href="mailto:lars.ellenberg@linbit.com">lars.ellenberg@linbit.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
<div class="im">On Thu, Jun 23, 2011 at 07:39:00AM -0300, Thiago Vinhas wrote:<br>
&gt; Hi,<br>
&gt;<br>
&gt; I&#39;m testing a DRBD+MySQL environment in production, but after a while the<br>
&gt; second node always gets disconnected, and I have no idea if it&#39;s a hardware<br>
&gt; problem or missconfiguration.<br>
&gt; The second node is not even mounted. I&#39;m just replicating the data, not<br>
&gt; using it.<br>
&gt;<br>
&gt; The error is on the end of the message. Here is my conf:<br>
&gt;<br>
&gt;<br>
&gt; resource r0 {<br>
&gt;         meta-disk internal;<br>
&gt;         device /dev/drbd0;<br>
&gt;         disk /dev/sda4;<br>
&gt;<br>
&gt;         syncer { rate 33M; }<br>
&gt;<br>
&gt;         handlers {<br>
&gt;         split-brain &quot;/etc/init.d/mysql stop&quot;;<br>
&gt;         }<br>
&gt;<br>
&gt;         net {<br>
&gt;                 allow-two-primaries;<br>
<br>
</div>WHY?? You very likely do not want two primaries,<br>
only you do not know it yet ;-)<br>
<div class="im"><br>
<br>
&gt;                 after-sb-0pri discard-zero-changes;<br>
&gt;                 after-sb-1pri discard-secondary;<br>
&gt;                 after-sb-2pri disconnect;<br>
&gt;                 data-integrity-alg crc32c;<br>
<br>
</div>Have you read<br>
<br>
<a href="http://www.mail-archive.com/drbd-user@lists.linbit.com/msg03373.html" target="_blank">http://www.mail-archive.com/drbd-user@lists.linbit.com/msg03373.html</a><br>
<div class="im"><br>
<br>
&gt;                 ko-count 4;<br>
&gt;         }<br>
&gt;<br>
&gt;         startup { become-primary-on both; }<br>
<br>
</div>Why??<br>
You do not want that.<br>
Really.<br>
Most people trying to use &quot;dual primary DRBD&quot;<br>
are really not needing it.<br>
<br>
If you think you really want it, make sure that you understand,<br>
and are able to deal with, the additional complexity it involves.<br>
<br>
You realize of course that concurrent access with standard file systems<br>
simply does not work, for that you need to use OCFS or GFS.<br>
<div><div></div><div class="h5"><br>
&gt;         on stewart { address <a href="http://192.168.0.1:7789" target="_blank">192.168.0.1:7789</a>; }<br>
&gt;         on prost { address <a href="http://192.168.0.2:7789" target="_blank">192.168.0.2:7789</a>; }<br>
&gt; }<br>
&gt;<br>
&gt;<br>
&gt; Is there something wrong in my conf? Should I change something?<br>
&gt; Another problem is that after the second node gets disconnected, I have to<br>
&gt; reconnect it my hand my running &quot;drbdadm connect r0&quot;. Aparently after<br>
&gt; running it the nodes get quickly re-synced (less then a minute), and the<br>
&gt; previously disconnected node starts as Secondary, so I had to run &quot;drbdadm<br>
&gt; primary r0&quot;.<br>
&gt;<br>
&gt; Both nodes are Dell PowerEdge R710 with 48GB of ram, running RHEL 5.6 and<br>
&gt; DRBD 8.3.10 (from ElRepo).<br>
&gt;<br>
&gt; Am I missing something here?<br>
&gt;<br>
&gt;<br>
&gt; Thanks for any help!<br>
&gt;<br>
&gt; Regards,<br>
&gt; Thiago Vinhas<br>
&gt; block drbd0: Digest integrity check FAILED: 63266864s +4096<br>
&gt; block drbd0: error receiving Data, l: 4136!<br>
&gt; block drbd0: peer( Primary -&gt; Unknown ) conn( Connected -&gt; ProtocolError )<br>
&gt; pdsk( UpToDate -&gt; DUnknown )<br>
&gt; block drbd0: new current UUID<br>
&gt; 66983E6BBEE733F5:6157ABDB87926AA5:0001000000000001:5905CD0F6B61A6A9<br>
&gt; block drbd0: asender terminated<br>
&gt; block drbd0: Terminating asender thread<br>
&gt; block drbd0: Connection closed<br>
&gt; block drbd0: conn( ProtocolError -&gt; Unconnected )<br>
&gt; block drbd0: receiver terminated<br>
&gt; block drbd0: Restarting receiver thread<br>
&gt; block drbd0: receiver (re)started<br>
&gt; block drbd0: conn( Unconnected -&gt; WFConnection )<br>
&gt; block drbd0: Handshake successful: Agreed network protocol version 96<br>
&gt; block drbd0: conn( WFConnection -&gt; WFReportParams )<br>
&gt; block drbd0: Starting asender thread (from drbd0_receiver [7794])<br>
&gt; block drbd0: data-integrity-alg: md5<br>
&gt; block drbd0: drbd_sync_handshake:<br>
&gt; block drbd0: self<br>
&gt; 66983E6BBEE733F5:6157ABDB87926AA5:0001000000000001:5905CD0F6B61A6A9 bits:0<br>
&gt; flags:0<br>
&gt; block drbd0: peer<br>
&gt; 4C9FC71A2D13AF9F:6157ABDB87926AA5:0001000000000000:5905CD0F6B61A6A9 bits:40<br>
&gt; flags:0<br>
&gt; block drbd0: uuid_compare()=100 by rule 90<br>
&gt; block drbd0: helper command: /sbin/drbdadm initial-split-brain minor-0<br>
&gt; block drbd0: helper command: /sbin/drbdadm initial-split-brain minor-0 exit<br>
&gt; code 0 (0x0)<br>
&gt; block drbd0: Split-Brain detected but unresolved, dropping connection!<br>
&gt; block drbd0: helper command: /sbin/drbdadm split-brain minor-0<br>
&gt; block drbd0: meta connection shut down by peer.<br>
&gt; block drbd0: conn( WFReportParams -&gt; NetworkFailure )<br>
&gt; block drbd0: asender terminated<br>
&gt; block drbd0: Terminating asender thread<br>
&gt; block drbd0: helper command: /sbin/drbdadm split-brain minor-0 exit code 0<br>
&gt; (0x0)<br>
&gt; block drbd0: conn( NetworkFailure -&gt; Disconnecting )<br>
&gt; block drbd0: error receiving ReportState, l: 4!<br>
&gt; block drbd0: Connection closed<br>
&gt; block drbd0: conn( Disconnecting -&gt; StandAlone )<br>
&gt; block drbd0: receiver terminated<br>
&gt; block drbd0: Terminating receiver thread<br>
&gt;<br>
&gt; Abs,<br>
&gt; Thiago Vinhas<br>
<br>
</div></div>&gt; _______________________________________________<br>
&gt; drbd-user mailing list<br>
&gt; <a href="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</a><br>
&gt; <a href="http://lists.linbit.com/mailman/listinfo/drbd-user" target="_blank">http://lists.linbit.com/mailman/listinfo/drbd-user</a><br>
<br>
<br>
--<br>
: Lars Ellenberg<br>
: LINBIT | Your Way to High Availability<br>
: DRBD/HA support and consulting <a href="http://www.linbit.com" target="_blank">http://www.linbit.com</a><br>
<br>
DRBD® and LINBIT® are registered trademarks of LINBIT, Austria.<br>
__<br>
please don&#39;t Cc me, but send to list   --   I&#39;m subscribed<br>
_______________________________________________<br>
drbd-user mailing list<br>
<a href="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</a><br>
<a href="http://lists.linbit.com/mailman/listinfo/drbd-user" target="_blank">http://lists.linbit.com/mailman/listinfo/drbd-user</a><br>
</blockquote></div><br>