Hi,<div><br></div><div>Thanks for the reply. </div><div><br></div><div>The multi volume feature is quite useful. With this I can for example switch Primary/Secondary individually if mysql or pgsql crashed without affecting each other. </div>
<div><br></div><div>By no means of urging, it would be great if you can tell when the next release would be so I can test? Also is 8.3.12 workable - I will give it a test anyway if it is long to wait for the next release.</div>
<div><br></div><div>Many thanks,</div><div><br></div><div><br><br><div class="gmail_quote">On Wed, Nov 16, 2011 at 11:03 PM, Lars Ellenberg <span dir="ltr">&lt;<a href="mailto:lars.ellenberg@linbit.com">lars.ellenberg@linbit.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;"><div class="im">On Wed, Nov 16, 2011 at 01:01:38PM +1100, Steve Kieu wrote:<br>
&gt; Hello,<br>
&gt;<br>
&gt; I am experimenting drbd and not quite good in stability (un usable). I saw<br>
&gt; this in dmesg log:<br>
&gt;<br>
&gt; block drbd1: md_sync_timer expired! Worker calls drbd_md_sync<br>
&gt; ().<br>
<br>
</div>Usually, especially with &quot;huge&quot; devices, this is no reason to worry.<br>
No need to do _anything_.<br>
<div class="im"><br>
&gt; At fist restart it works for a while, and then all of sudden - cat<br>
&gt; /proc/drbd show ProtocolError and system hang (mysql or any other process<br>
&gt; read/write to the drbd partitions.<br>
&gt;<br>
&gt; It is repeatable and when it happend network is not busy, machine load is<br>
&gt; nearly 0 and all other network connectivity is normal.<br>
&gt;<br>
&gt; Googling show me that many users has same problem and one suggested to<br>
&gt; lower the rate of resync and sync, I did that (for 100Mbit ethernet I set<br>
&gt; resync is 3M and in syncer  rate 40M; I setup two volumes . Problem still.<br>
&gt;<br>
&gt;<br>
&gt; Here is the short description of the system:<br>
&gt;<br>
&gt; * Centos 6  x86_64<br>
&gt; * Kernel 2.6.32.43-vs2.3.0.36.29.8-h1-32cpu-noselinux which is vanilar<br>
&gt; kernel 2.6.32.43 with vserver patch vs2.3.0.36.29.8 - compile with HZ = 100<br>
&gt; and SMP for 32 cpu<br>
&gt; * DRBD compiled from source, version 8.4.0 (including kernel module)<br>
<br>
</div>8.4.0 seems to have serious stability issues under moderate to heavy IO<br>
when actually using the multi volume feature :-(<br>
We are preparing a 8.4.1.<br>
<div><div></div><div class="h5"><br>
&gt; * DRBD build on top of LVM here is the config<br>
&gt;<br>
&gt; resource r0 {<br>
&gt;<br>
&gt;           on cosmos {<br>
&gt;                   volume 0 {<br>
&gt;                     #device minor 0;<br>
&gt;                     device /dev/drbd0;<br>
&gt;                     meta-disk internal;<br>
&gt;                     disk  /dev/vs-resource1/mysqldata;<br>
&gt;                   }<br>
&gt;<br>
&gt;                   volume 1 {<br>
&gt;                     device /dev/drbd1;<br>
&gt;                     meta-disk internal;<br>
&gt;                     disk  /dev/vs-resource1/pgsqldata;<br>
&gt;                   }<br>
&gt;<br>
&gt;                   address   <a href="http://10.200.11.4:7789" target="_blank">10.200.11.4:7789</a>;<br>
&gt;            }<br>
&gt;<br>
&gt;           on seaspray {<br>
&gt;                  volume 0 {<br>
&gt;                         # device minor 0;<br>
&gt;                         device /dev/drbd0;<br>
&gt;                         meta-disk internal;<br>
&gt;                         disk      /dev/vg_seaspray/mysqldata;<br>
&gt;                  }<br>
&gt;<br>
&gt;                  volume 1 {<br>
&gt;                     device /dev/drbd1;<br>
&gt;                     meta-disk internal;<br>
&gt;                     disk  /dev/vg_seaspray/pgsqldata;<br>
&gt;                   }<br>
&gt;<br>
&gt;             address   <a href="http://10.200.11.3:7789" target="_blank">10.200.11.3:7789</a>;<br>
&gt;           }<br>
&gt;<br>
&gt;         startup {<br>
&gt;           #become-primary-on both;<br>
&gt;<br>
&gt;         }<br>
&gt;  net {<br>
&gt;                 #allow-two-primaries;<br>
&gt;                 protocol C;<br>
&gt;                 after-sb-0pri discard-zero-changes;<br>
&gt;                 after-sb-1pri discard-secondary;<br>
&gt;                 after-sb-2pri disconnect;<br>
&gt;                 #cram-hmac-alg sha1;<br>
&gt;                 #shared-secret &quot;FooFunFactory&quot;;<br>
&gt;<br>
&gt;         }<br>
&gt;<br>
&gt;<br>
&gt; }<br>
&gt;<br>
&gt; * DRBD runs in Primary/Secondary mode for now. The device is mounted into a<br>
&gt; vserver instance and mysql and postgres is running from the vserver<br>
&gt; * IPtables is setup to allow DRBD trafic - it happened even iptables is off<br>
&gt;<br>
&gt; * Network route<br>
&gt; route<br>
&gt; Kernel IP routing table<br>
&gt; Destination     Gateway         Genmask         Flags Metric Ref    Use<br>
&gt; Iface<br>
&gt; 10.200.11.0     *               255.255.255.224 U     0      0        0 eth0<br>
&gt; 10.200.11.128   *               255.255.255.192 U     0      0        0<br>
&gt; eth1.503<br>
&gt; 192.168.100.0   *               255.255.255.0   U     0      0        0<br>
&gt; dummy0<br>
&gt; 1.1.1.0         *               255.255.255.0   U     0      0        0<br>
&gt; vmbr0<br>
&gt; link-local      *               255.255.0.0     U     1002   0        0 eth0<br>
&gt; link-local      *               255.255.0.0     U     1003   0        0 eth1<br>
&gt; link-local      *               255.255.0.0     U     1004   0        0<br>
&gt; eth1.503<br>
&gt; default         10.200.11.1     0.0.0.0         UG    0      0        0 eth0<br>
&gt;<br>
&gt; I attach the dmesg here as well if it helps to debug. I would like to have<br>
&gt; it fixed so please help.<br>
&gt;<br>
&gt; Many thanks,<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; --<br>
&gt; Steve Kieu<br>
<br>
<br>
</div></div>&gt; _______________________________________________<br>
&gt; drbd-user mailing list<br>
&gt; <a href="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</a><br>
&gt; <a href="http://lists.linbit.com/mailman/listinfo/drbd-user" target="_blank">http://lists.linbit.com/mailman/listinfo/drbd-user</a><br>
<font color="#888888"><br>
<br>
--<br>
: Lars Ellenberg<br>
: LINBIT | Your Way to High Availability<br>
: DRBD/HA support and consulting <a href="http://www.linbit.com" target="_blank">http://www.linbit.com</a><br>
<br>
DRBD® and LINBIT® are registered trademarks of LINBIT, Austria.<br>
__<br>
please don&#39;t Cc me, but send to list   --   I&#39;m subscribed<br>
_______________________________________________<br>
drbd-user mailing list<br>
<a href="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</a><br>
<a href="http://lists.linbit.com/mailman/listinfo/drbd-user" target="_blank">http://lists.linbit.com/mailman/listinfo/drbd-user</a><br>
</font></blockquote></div><br><br clear="all"><div><br></div>-- <br>Steve Kieu<br>
</div>