<html>
  <head>
    <meta content="text/html; charset=ISO-8859-1"
      http-equiv="Content-Type">
  </head>
  <body bgcolor="#FFFFFF" text="#000000">
    Hello again,<br>
    <br>
    After comparing DRBD 8.3 and 8.4 source code, I see that conditional
    TCP_CORK-ing remains to be done in 8.4. Can it be the reason why we
    experiment PingAck problems on idle resources ?<br>
    <br>
    PS: our cluster was running DRBD 8.3 beforehands and we had no such
    problem... but we were also using Infiniband SDP instead of IPoIB
    (so we can not know whether the problem really lies with DRBD).<br>
    <br>
    Thanks for your insights,<br>
    <br>
    C&eacute;dric<br>
    <br>
    <div class="moz-cite-prefix">On 02/02/14 21:29, C&eacute;dric Dufour -
      Idiap Research Institute wrote:<br>
    </div>
    <blockquote cite="mid:52EEAA8D.2000102@idiap.ch" type="cite">
      <meta http-equiv="content-type" content="text/html;
        charset=ISO-8859-1">
      Hello,<br>
      <br>
      We are experiencing "PingAck timeout" on a system where multiple
      DRBD resources are configured (more exactly a pair of
      active/active Lustre MDS servers):<br>
      <br>
      A --- drbd0 --- B&nbsp; [nfs-data] idle<br>
      A --- drbd1 --- B&nbsp; [nfs-apps] idle<br>
      A --- drbd2 --- B&nbsp; [nfs-tmp] idle<br>
      A --&gt; drbd3 --&gt; B&nbsp; [mdt1] heavy load<br>
      A &lt;-- drbd4 &lt;-- B&nbsp; [mdt2] heavy load<br>
      A --- drbd5 --- B&nbsp; [mgs] idle<br>
      <br>
      Our environment is DRBD 8.4.4, with "ping-int = 10s" and
      "ping-timeout = 25" (2.5s)<br>
      <br>
      The link between the two servers is 20Gb/s Infiniband (configured
      in datagram mode).<br>
      <br>
      Strangely, the timeout occurs on an idle resource (e.g. drbd1)
      when two of the other resources ('mdt1' and 'mdt2') are heavily
      loaded (and displaying no connection/timeout problem
      what-so-ever).<br>
      <br>
      Looking at the source code, I believe that DRBD cannot know about
      the potentially "congested" link (because of the heavily loaded
      resources, 'mdt1' and 'mdt2') and the potentially resulting
      PingAck timeout it may spawn for another idle one (e.g. 'drbd1').
      Am I right ?<br>
      <br>
      Is there a way to circumvent this problem ?<br>
      <br>
      Thanks and best,<br>
      <br>
      C&eacute;dric Dufour<br>
      <div class="moz-signature">-- <br>
        <meta http-equiv="Content-Type" content="text/html;
          charset=ISO-8859-1">
        <style type="text/css">
DIV.signature {FONT:normal 11px sans-serif;COLOR:#000000;}
DIV.signature P {MARGIN:5px 0px;FONT:bold 13px sans-serif;COLOR:#000050;}
</style>
        <div class="signature">
          <p>C&eacute;dric Dufour @ Idiap Research Institute</p>
        </div>
      </div>
      <br>
      <fieldset class="mimeAttachmentHeader"></fieldset>
      <br>
      <pre wrap="">_______________________________________________
drbd-user mailing list
<a class="moz-txt-link-abbreviated" href="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</a>
<a class="moz-txt-link-freetext" href="http://lists.linbit.com/mailman/listinfo/drbd-user">http://lists.linbit.com/mailman/listinfo/drbd-user</a>
</pre>
    </blockquote>
    <br>
  </body>
</html>