Hi Andreas<br><br>Thank you.<br><br>Couldn&#39;t try &quot;drbdadm invalidate-remote mysql&quot; because when both nodes are connected it forces a sync (SyncSource &gt; SyncTarget)...<br>If I disconnect the primary first then issue &quot;drbdadm invalidate-remote mysql&quot; I get:<br>
<br>0: State change failed: (-15) Need a connection to start verify or resync<br>Command &#39;drbdsetup invalidate-remote 0&#39; terminated with exit code 11<br><br>Kind regards,<br>Fred<br><br><div class="gmail_quote">On Wed, Feb 1, 2012 at 9:18 PM, Andreas Kurz <span dir="ltr">&lt;<a href="mailto:andreas@hastexo.com">andreas@hastexo.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="im">On 02/01/2012 05:15 PM, Frederic DeMarcy wrote:<br>
&gt; Hi Andrea<br>
&gt;<br>
&gt; Commenting out &quot;csum-alg&quot; doesn&#39;t seem to make any noticeable difference...<br>
&gt; However commenting out &quot;data-integrity-alg&quot; and running Test #2 again<br>
&gt; increases the throughput from ~ 61MB/s to ~ 97MB/s !<br>
&gt; Note that I may well run into the 1Gb/s crossover link limit here since<br>
&gt; my network tests showed ~ 0.94 Gb/s<br>
&gt;<br>
&gt; Also Test #1 was wrong in my email... It should have been split in 2:<br>
&gt; Test #1<br>
&gt; On non-DRBD device (/dev/sda)<br>
&gt; # dd if=/dev/zero of=/home/userxxx/disk-test.xxx bs=1M count=4096<br>
&gt; oflag=direct<br>
&gt; Throughput ~ 420MB/s<br>
&gt;<br>
&gt; DRBD partition (/dev/sdb) on primary (secondary node disabled)<br>
&gt; Using Base DRBD config<br>
&gt; # dd if=/dev/zero of=/var/lib/mysql/TMP/disk-test.xxx bs=1M count=4096<br>
&gt; oflag=direct<br>
&gt; Throughput ~ 205MB/s<br>
<br>
</div>Is the result the same if you execute a &quot;drbdadm invalidate-remote<br>
mysql&quot; on the primary before doing the &quot;single node&quot; test? .... that<br>
would disable activity log updates ...<br>
<div class="im"><br>
Regards,<br>
Andreas<br>
<br>
--<br>
Need help with DRBD?<br>
</div><a href="http://www.hastexo.com/services/remote" target="_blank">http://www.hastexo.com/services/remote</a><br>
<div class="im"><br>
&gt;<br>
&gt; With the above -alg commented out, disabling the secondary node and<br>
&gt; running Test #1 again (correctly split this time) shows the same<br>
&gt; throughputs of ~ 420MB/s and ~ 205MB/s<br>
&gt;<br>
&gt; Fred<br>
&gt;<br>
&gt; On Wed, Feb 1, 2012 at 1:48 PM, Andreas Kurz &lt;<a href="mailto:andreas@hastexo.com">andreas@hastexo.com</a><br>
</div><div><div class="h5">&gt; &lt;mailto:<a href="mailto:andreas@hastexo.com">andreas@hastexo.com</a>&gt;&gt; wrote:<br>
&gt;<br>
&gt;     Hello,<br>
&gt;<br>
&gt;     On 02/01/2012 01:04 PM, Frederic DeMarcy wrote:<br>
&gt;     &gt; Hi<br>
&gt;     &gt;<br>
&gt;     &gt; Note 1:<br>
&gt;     &gt; Scientific Linux 6.1 with kernel 2.6.32-220.4.1.el6.x86_64<br>
&gt;     &gt; DRBD 8.4.1 compiled from source<br>
&gt;     &gt;<br>
&gt;     &gt; Note 2:<br>
&gt;     &gt; server1 and server2 are 2 VMware VMs on top of ESXi 5. However<br>
&gt;     they reside on different physical 2U servers.<br>
&gt;     &gt; The specs for the 2U servers are identical:<br>
&gt;     &gt;   - HP DL380 G7 (2U)<br>
&gt;     &gt;   - 2 x Six Core Intel Xeon X5680 (3.33GHz)<br>
&gt;     &gt;   - 24GB RAM<br>
&gt;     &gt;   - 8 x 146 GB SAS HD&#39;s (7xRAID5 + 1s)<br>
&gt;     &gt;   - Smart Array P410i with 512MB BBWC<br>
&gt;<br>
&gt;     Have you tried to change the I/O scheduler to deadline or noop in<br>
&gt;     the VMs?<br>
&gt;<br>
&gt;     ... see below ..<br>
&gt;<br>
&gt;     &gt;<br>
&gt;     &gt; Note 3:<br>
&gt;     &gt; I&#39;ve tested the network throughput with iperf which yields close<br>
&gt;     to 1Gb/s<br>
&gt;     &gt; [root@server1 ~]# iperf -c 192.168.111.11 -f g<br>
&gt;     &gt; ------------------------------------------------------------<br>
&gt;     &gt; Client connecting to 192.168.111.11, TCP port 5001<br>
&gt;     &gt; TCP window size: 0.00 GByte (default)<br>
&gt;     &gt; ------------------------------------------------------------<br>
&gt;     &gt; [  3] local 192.168.111.10 port 54330 connected with<br>
&gt;     192.168.111.11 port 5001<br>
&gt;     &gt; [ ID] Interval       Transfer     Bandwidth<br>
&gt;     &gt; [  3]  0.0-10.0 sec  1.10 GBytes  0.94 Gbits/sec<br>
&gt;     &gt;<br>
&gt;     &gt; [root@server2 ~]# iperf -s -f g<br>
&gt;     &gt; ------------------------------------------------------------<br>
&gt;     &gt; Server listening on TCP port 5001<br>
&gt;     &gt; TCP window size: 0.00 GByte (default)<br>
&gt;     &gt; ------------------------------------------------------------<br>
&gt;     &gt; [  4] local 192.168.111.11 port 5001 connected with 192.168.111.10<br>
&gt;     port 54330<br>
&gt;     &gt; [ ID] Interval       Transfer     Bandwidth<br>
&gt;     &gt; [  4]  0.0-10.0 sec  1.10 GBytes  0.94 Gbits/sec<br>
&gt;     &gt;<br>
&gt;     &gt; Scp&#39;ing a large file from server1 to server2 yields ~ 57MB/s but I<br>
&gt;     guess it&#39;s due to the encryption overhead.<br>
&gt;     &gt;<br>
&gt;     &gt; Note 4:<br>
&gt;     &gt; MySQL was not running.<br>
&gt;     &gt;<br>
&gt;     &gt;<br>
&gt;     &gt;<br>
&gt;     &gt; Base DRBD config:<br>
&gt;     &gt; resource mysql {<br>
&gt;     &gt;   startup {<br>
&gt;     &gt;     wfc-timeout 3;<br>
&gt;     &gt;     degr-wfc-timeout 2;<br>
&gt;     &gt;     outdated-wfc-timeout 1;<br>
&gt;     &gt;   }<br>
&gt;     &gt;   net {<br>
&gt;     &gt;     protocol C;<br>
&gt;     &gt;     verify-alg sha1;<br>
&gt;     &gt;     csums-alg sha1;<br>
&gt;<br>
&gt;     using csums based resync is only interesting for WAN setups where you<br>
&gt;     need to sync via a rather thin connection<br>
&gt;<br>
&gt;     &gt;     data-integrity-alg sha1;<br>
&gt;<br>
&gt;     using data-integrity-alg is definitely not recommended (slow) for live<br>
&gt;     setups, only if you have to assume there is buggy hardware on the way<br>
&gt;     between your nodes ... like nics pretending csums are ok while they<br>
&gt;     are not<br>
&gt;<br>
&gt;     and out of curiosity ... did you gave DRBD 8.3.12 already a try?<br>
&gt;<br>
&gt;     Regards,<br>
&gt;     Andreas<br>
&gt;<br>
&gt;     --<br>
&gt;     Need help with DRBD?<br>
&gt;     <a href="http://www.hastexo.com/now" target="_blank">http://www.hastexo.com/now</a><br>
&gt;<br>
&gt;<br>
&gt;     &gt;     cram-hmac-alg sha1;<br>
&gt;     &gt;     shared-secret &quot;MySecret123&quot;;<br>
&gt;     &gt;   }<br>
&gt;     &gt;   on server1 {<br>
&gt;     &gt;     device    /dev/drbd0;<br>
&gt;     &gt;     disk      /dev/sdb;<br>
</div></div>&gt;     &gt;     address   <a href="http://192.168.111.10:7789" target="_blank">192.168.111.10:7789</a> &lt;<a href="http://192.168.111.10:7789" target="_blank">http://192.168.111.10:7789</a>&gt;;<br>
<div class="im">&gt;     &gt;     meta-disk internal;<br>
&gt;     &gt;   }<br>
&gt;     &gt;   on server2 {<br>
&gt;     &gt;     device    /dev/drbd0;<br>
&gt;     &gt;     disk      /dev/sdb;<br>
</div>&gt;     &gt;     address   <a href="http://192.168.111.11:7789" target="_blank">192.168.111.11:7789</a> &lt;<a href="http://192.168.111.11:7789" target="_blank">http://192.168.111.11:7789</a>&gt;;<br>
<div><div class="h5">&gt;     &gt;     meta-disk internal;<br>
&gt;     &gt;   }<br>
&gt;     &gt; }<br>
&gt;     &gt;<br>
&gt;     &gt;<br>
&gt;     &gt; After any change in the /etc/drbd.d/mysql.res file I issued a<br>
&gt;     &quot;drbdadm adjust mysql&quot; on both nodes.<br>
&gt;     &gt;<br>
&gt;     &gt; Test #1<br>
&gt;     &gt; DRBD partition on primary (secondary node disabled)<br>
&gt;     &gt; Using Base DRBD config<br>
&gt;     &gt; # dd if=/dev/zero of=/var/lib/mysql/TMP/disk-test.xxx bs=1M<br>
&gt;     count=4096 oflag=direct<br>
&gt;     &gt; Throughput ~ 420MB/s<br>
&gt;     &gt;<br>
&gt;     &gt; Test #2<br>
&gt;     &gt; DRBD partition on primary (secondary node enabled)<br>
&gt;     &gt; Using Base DRBD config<br>
&gt;     &gt; # dd if=/dev/zero of=/var/lib/mysql/TMP/disk-test.xxx bs=1M<br>
&gt;     count=4096 oflag=direct<br>
&gt;     &gt; Throughput ~ 61MB/s<br>
&gt;     &gt;<br>
&gt;     &gt; Test #3<br>
&gt;     &gt; DRBD partition on primary (secondary node enabled)<br>
&gt;     &gt; Using Base DRBD config with:<br>
&gt;     &gt;   Protocol B;<br>
&gt;     &gt; # dd if=/dev/zero of=/var/lib/mysql/TMP/disk-test.xxx bs=1M<br>
&gt;     count=4096 oflag=direct<br>
&gt;     &gt; Throughput ~ 68MB/s<br>
&gt;     &gt;<br>
&gt;     &gt; Test #4<br>
&gt;     &gt; DRBD partition on primary (secondary node enabled)<br>
&gt;     &gt; Using Base DRBD config with:<br>
&gt;     &gt;   Protocol A;<br>
&gt;     &gt; # dd if=/dev/zero of=/var/lib/mysql/TMP/disk-test.xxx bs=1M<br>
&gt;     count=4096 oflag=direct<br>
&gt;     &gt; Throughput ~ 94MB/s<br>
&gt;     &gt;<br>
&gt;     &gt; Test #5<br>
&gt;     &gt; DRBD partition on primary (secondary node enabled)<br>
&gt;     &gt; Using Base DRBD config with:<br>
&gt;     &gt;   disk {<br>
&gt;     &gt;     disk-barrier no;<br>
&gt;     &gt;     disk-flushes no;<br>
&gt;     &gt;     md-flushes no;<br>
&gt;     &gt;   }<br>
&gt;     &gt; # dd if=/dev/zero of=/var/lib/mysql/TMP/disk-test.xxx bs=1M<br>
&gt;     count=4096 oflag=direct<br>
&gt;     &gt; Disk throughput ~ 62MB/s<br>
&gt;     &gt;<br>
&gt;     &gt; No difference from Test #2 really. Also cat /proc/drbd still shows<br>
&gt;     wo:b in both cases so I&#39;m not even sure<br>
&gt;     &gt; these disk {..} parameters have been taken into account...<br>
&gt;     &gt;<br>
&gt;     &gt; Test #6<br>
&gt;     &gt; DRBD partition on primary (secondary node enabled)<br>
&gt;     &gt; Using Base DRBD config with:<br>
&gt;     &gt;   Protocol B;<br>
&gt;     &gt;   disk {<br>
&gt;     &gt;     disk-barrier no;<br>
&gt;     &gt;     disk-flushes no;<br>
&gt;     &gt;     md-flushes no;<br>
&gt;     &gt;   }<br>
&gt;     &gt; # dd if=/dev/zero of=/var/lib/mysql/TMP/disk-test.xxx bs=1M<br>
&gt;     count=4096 oflag=direct<br>
&gt;     &gt; Disk throughput ~ 68MB/s<br>
&gt;     &gt;<br>
&gt;     &gt; No difference from Test #3 really. Also cat /proc/drbd still shows<br>
&gt;     wo:b in both cases so I&#39;m not even sure<br>
&gt;     &gt; these disk {..} parameters have been taken into account...<br>
&gt;     &gt;<br>
&gt;     &gt;<br>
&gt;     &gt; What else can I try?<br>
&gt;     &gt; Is it worth trying DRBD 8.3.x?<br>
&gt;     &gt;<br>
&gt;     &gt; Thx.<br>
&gt;     &gt;<br>
&gt;     &gt; Fred<br>
&gt;     &gt;<br>
&gt;     &gt;<br>
&gt;     &gt;<br>
&gt;     &gt;<br>
&gt;     &gt;<br>
&gt;     &gt;<br>
&gt;     &gt; On 1 Feb 2012, at 08:35, James Harper wrote:<br>
&gt;     &gt;<br>
&gt;     &gt;&gt;&gt; Hi<br>
&gt;     &gt;&gt;&gt;<br>
&gt;     &gt;&gt;&gt; I&#39;ve configured DRBD with a view to use it with MySQL (and later on<br>
&gt;     &gt;&gt;&gt; Pacemaker + Corosync) in a 2 nodes primary/secondary<br>
&gt;     &gt;&gt;&gt; (master/slave) setup.<br>
&gt;     &gt;&gt;&gt;<br>
&gt;     &gt;&gt;&gt; ...<br>
&gt;     &gt;&gt;&gt;<br>
&gt;     &gt;&gt;&gt; No replication over the 1Gb/s crossover cable is taking place<br>
&gt;     since the<br>
&gt;     &gt;&gt;&gt; secondary node is down yet there&#39;s x2 lower disk performance.<br>
&gt;     &gt;&gt;&gt;<br>
&gt;     &gt;&gt;&gt; I&#39;ve tried to add:<br>
&gt;     &gt;&gt;&gt;  disk {<br>
&gt;     &gt;&gt;&gt;    disk-barrier no;<br>
&gt;     &gt;&gt;&gt;    disk-flushes no;<br>
&gt;     &gt;&gt;&gt;    md-flushes no;<br>
&gt;     &gt;&gt;&gt;  }<br>
&gt;     &gt;&gt;&gt; to the config but it didn&#39;t seem to change anything.<br>
&gt;     &gt;&gt;&gt;<br>
&gt;     &gt;&gt;&gt; Am I missing something here?<br>
&gt;     &gt;&gt;&gt; On another note is 8.4.1 the right version to use?<br>
&gt;     &gt;&gt;&gt;<br>
&gt;     &gt;&gt;<br>
&gt;     &gt;&gt; If you can do it just for testing, try changing to protocol B<br>
&gt;     with one primary and one secondary and see how that impacts your<br>
&gt;     performance, both with barrier/flushes on and off. I&#39;m not sure if<br>
&gt;     it will help but if protocol B makes things faster then it might<br>
&gt;     hint as to where to start looking...<br>
&gt;     &gt;&gt;<br>
&gt;     &gt;&gt; James<br>
&gt;     &gt;<br>
&gt;     &gt; _______________________________________________<br>
&gt;     &gt; drbd-user mailing list<br>
</div></div>&gt;     &gt; <a href="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</a> &lt;mailto:<a href="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</a>&gt;<br>
<div class="im">&gt;     &gt; <a href="http://lists.linbit.com/mailman/listinfo/drbd-user" target="_blank">http://lists.linbit.com/mailman/listinfo/drbd-user</a><br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;     _______________________________________________<br>
&gt;     drbd-user mailing list<br>
</div>&gt;     <a href="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</a> &lt;mailto:<a href="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</a>&gt;<br>
<div class="HOEnZb"><div class="h5">&gt;     <a href="http://lists.linbit.com/mailman/listinfo/drbd-user" target="_blank">http://lists.linbit.com/mailman/listinfo/drbd-user</a><br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; drbd-user mailing list<br>
&gt; <a href="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</a><br>
&gt; <a href="http://lists.linbit.com/mailman/listinfo/drbd-user" target="_blank">http://lists.linbit.com/mailman/listinfo/drbd-user</a><br>
<br>
<br>
<br>
<br>
</div></div><br>_______________________________________________<br>
drbd-user mailing list<br>
<a href="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</a><br>
<a href="http://lists.linbit.com/mailman/listinfo/drbd-user" target="_blank">http://lists.linbit.com/mailman/listinfo/drbd-user</a><br>
<br></blockquote></div><br>