<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40"><head><meta http-equiv=Content-Type content="text/html; charset=utf-8"><meta name=Generator content="Microsoft Word 15 (filtered medium)"><style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
..MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri","sans-serif";
        mso-fareast-language:EN-US;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:70.85pt 70.85pt 70.85pt 70.85pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]--></head><body lang=FR link=blue vlink=purple><div class=WordSection1><p class=MsoNormal><span lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D;mso-fareast-language:EN-US'>Are you using iSCSI to access your volumes&nbsp;? Might worth it activating iSCSI digests on both sides and see how it behaves then, wouldn’t it ? You’d probably lose some perfs but it would probably too help you identify the root cause of your problems I guess…<o:p></o:p></span></p><p class=MsoNormal><span lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D;mso-fareast-language:EN-US'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal><span lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D;mso-fareast-language:EN-US'>Regards,<o:p></o:p></span></p><p class=MsoNormal><span lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D;mso-fareast-language:EN-US'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal><span lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D;mso-fareast-language:EN-US'>Pascal.<o:p></o:p></span></p><p class=MsoNormal><span lang=EN-US style='font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D;mso-fareast-language:EN-US'><o:p>&nbsp;</o:p></span></p><p class=MsoNormal><b><span style='font-size:11.0pt;font-family:"Calibri","sans-serif"'>De&nbsp;:</span></b><span style='font-size:11.0pt;font-family:"Calibri","sans-serif"'> drbd-user-bounces@lists.linbit.com [mailto:drbd-user-bounces@lists.linbit.com] <b>De la part de</b> Stanislav German-Evtushenko<br><b>Envoyé&nbsp;:</b> lundi 27 janvier 2014 13:51<br><b>À&nbsp;:</b> Bram Matthys<br><b>Cc&nbsp;:</b> drbd-user<br><b>Objet&nbsp;:</b> Re: [DRBD-user] BUG: Uncatchable DRBD out-of-sync issue<o:p></o:p></span></p><p class=MsoNormal><o:p>&nbsp;</o:p></p><div><div><p class=MsoNormal><o:p>&nbsp;</o:p></p><div><p class=MsoNormal>On Mon, Jan 27, 2014 at 4:18 PM, Bram Matthys &lt;<a href="mailto:syzop@vulnscan.org" target="_blank">syzop@vulnscan.org</a>&gt; wrote:<o:p></o:p></p><blockquote style='border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm'><p class=MsoNormal>-----BEGIN PGP SIGNED MESSAGE-----<br>Hash: SHA256<br><br>Hi,<br><br>Just jumping in, unaware of the history of this thread...<br><br>Stanislav German-Evtushenko wrote, on 27-1-2014 7:08:<o:p></o:p></p><div><p class=MsoNormal>&gt;<br>&gt; On Thu, Apr 18, 2013 at 4:21 PM, Stanislav German-Evtushenko<o:p></o:p></p></div><div><p class=MsoNormal>&gt; &lt;<a href="mailto:ginermail@gmail.com">ginermail@gmail.com</a> &lt;mailto:<a href="mailto:ginermail@gmail.com">ginermail@gmail.com</a>&gt;&gt; wrote:<br>&gt;<br>&gt; &nbsp; &nbsp; No choice so far :)<br>&gt; &nbsp; &nbsp; <a href="http://pve.proxmox.com/wiki/Roadmap#Proxmox_VE_2.3" target="_blank">http://pve.proxmox.com/wiki/Roadmap#Proxmox_VE_2.3</a><br>&gt;<br>&gt; &nbsp; &nbsp; I don't think this is a kernel bug. Anyway would be nice if sombody<br>&gt; &nbsp; &nbsp; can investigate and fix or at least find work around. IDE is slow in<br>&gt; &nbsp; &nbsp; compare to VIRTIO.<br>&gt;<br>&gt; &nbsp; &nbsp; On Thu, Apr 18, 2013 at 2:31 PM, Felix Frank &lt;<a href="mailto:ff@mpexnet.de">ff@mpexnet.de</a><o:p></o:p></p></div><div><p class=MsoNormal style='margin-bottom:12.0pt'>&gt; &nbsp; &nbsp; &lt;mailto:<a href="mailto:ff@mpexnet.de">ff@mpexnet.de</a>&gt;&gt; wrote:<br>&gt; &nbsp; &nbsp; &gt; On 04/18/2013 12:20 PM, Stanislav German-Evtushenko wrote:<br>&gt; &nbsp; &nbsp; &gt;&gt;&gt; Note that your kernel (and hence kvm/virtio) can be considered<br>&gt; &nbsp; &nbsp; rather old by now.<br>&gt; &nbsp; &nbsp; &gt;&gt; This is a stable RHEL 6 kernel at the moment.<br>&gt; &nbsp; &nbsp; &gt;<br>&gt; &nbsp; &nbsp; &gt; Exactly ;-)<br>&gt; &nbsp; &nbsp; &gt;<br>&gt; &nbsp; &nbsp; &gt; Same for Debian 6, which I no longer consider fit for KVM setups<br>&gt; &nbsp; &nbsp; &gt; (without backports and such).<br>&gt;<br>&gt;<br>&gt; I have replaced all hard-drives on the first server and upgraded DRBD kernel<br>&gt; modules to 8.3.15. I do verifying every week. It usually founds new<br>&gt; out-of-sync sectors, then I check if they are false-positive or not (with<br>&gt; md5sum) and find that 95% of them are real.<br>&gt; Could anybody suggest a way to debug? Can it be DRBD + RAID problem? Or DRBD<br>&gt; + one specific RAID problem?<o:p></o:p></p></div><p class=MsoNormal>Have you figured out on which one of the servers the data is correct? And is<br>it always the same server? This assumes a primary/secondary setup.<br>If you know on which server the data is correct then you know - IF it's a<br>hardware problem - which server is at fault. If it's a software problem,<br>then you still can't tell.<br><br>Do you run a weekly/monthly RAID verification job? On both servers? Linux sw<br>raid has this, and presumably hw raid has this option as well.<br>This would pick up (most) RAID / disk issues.<br>Silent disk corruption on RAID arrays can occur and disk verification would<br>be the only way to tell (well, apart from using a filesystem like ZFS).<br><br>Good luck,<br><br>Bram.<br><br><br>- --<br>Bram Matthys<br>Software developer/IT consultant &nbsp; &nbsp; &nbsp; &nbsp;<a href="mailto:syzop@vulnscan.org">syzop@vulnscan.org</a><br>Website: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;<a href="http://www.vulnscan.org" target="_blank">www.vulnscan.org</a><br>PGP key: &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; <a href="http://www.vulnscan.org/pubkey.asc" target="_blank">www.vulnscan.org/pubkey.asc</a><br>PGP fp: EBCA 8977 FCA6 0AB0 6EDB &nbsp;04A7 6E67 6D45 7FE1 99A6<br>-----BEGIN PGP SIGNATURE-----<br>Version: GnuPG v2.0.17 (MingW32)<br><br>iF4EAREIAAYFAlLmToAACgkQbmdtRX/hmabbewD9HEaFbFw1j91AgDiAbgWcDari<br>qZ/fYOYBw/qyMMempbMA/iCKM5Y2Oa3XAUApPWc05cTZ+W9FyOGdOmNgIl4FMGE0<br>=z7Jn<br>-----END PGP SIGNATURE-----<br>_______________________________________________<br>drbd-user mailing list<br><a href="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</a><br><a href="http://lists.linbit.com/mailman/listinfo/drbd-user" target="_blank">http://lists.linbit.com/mailman/listinfo/drbd-user</a><o:p></o:p></p></blockquote></div><p class=MsoNormal><br><br>&gt; Have you figured out on which one of the servers the data is correct?<br>&gt; And is it always the same server?<br>It depends on what server is writing. On the one which write it is always correct.<br>Servers are identical and firmwares are up to date.<o:p></o:p></p><div><p class=MsoNormal><br>&gt; Do you run a weekly/monthly RAID verification job? On both servers?<o:p></o:p></p></div><div><p class=MsoNormal>That is nice point to try. I've been thinking I'd tried everything already.<o:p></o:p></p></div><div><p class=MsoNormal><br>&gt; This would pick up (most) RAID / disk issues.<o:p></o:p></p></div><div><p class=MsoNormal style='margin-bottom:12.0pt'>This is very unlikely, however I'll try to run RAID verification job on both and will come back with results.<o:p></o:p></p></div><p class=MsoNormal>Stanislav<o:p></o:p></p></div></div></div>
<br /><br />
<hr style='border:none; color:#909090; background-color:#B0B0B0; height: 1px; width: 99%;' />
<table style='border-collapse:collapse;border:none;'>
        <tr>
                <td style='border:none;padding:0px 15px 0px 8px'>
                        <a href="http://www.avast.com/">
                                <img border=0 src="http://static.avast.com/emails/avast-mail-stamp.png" />
                        </a>
                </td>
                <td>
                        <p style='color:#3d4d5a; font-family:"Calibri","Verdana","Arial","Helvetica"; font-size:12pt;'>
                                Ce courrier électronique ne contient aucun virus ou logiciel malveillant parce que la protection <a href="http://www.avast.com/">Antivirus avast!</a> est active.
                        </p>
                </td>
        </tr>
</table>
<br />
</body></html>