<html>
  <head>

    <meta http-equiv="content-type" content="text/html; charset=utf-8">
  </head>
  <body text="#000000" bgcolor="#FFFFFF">
    Hi All,<br>
    <br>
    I've run into some problems on my DRDB cluster this week. This
    cluster has been running fine for over a year. All of a sudden the
    secondary failed:<br>
    <br>
    Jan 14 08:37:58 data2 kernel: [4895290.318176] drbd r0: meta
    connection shut down by peer.<br>
    Jan 14 08:37:58 data2 kernel: [4895290.318361] drbd r0: peer(
    Primary -&gt; Unknown ) conn( Connected -&gt; NetworkFailure ) pdsk(
    UpToDate -&gt; DUnknown ) <br>
    Jan 14 08:37:58 data2 kernel: [4895290.318532] drbd r0: asender
    terminated<br>
    Jan 14 08:37:58 data2 kernel: [4895290.318534] drbd r0: Terminating
    drbd_a_r0<br>
    Jan 14 08:38:07 data2 kernel: [4895298.502391] drbd r0: Connection
    closed<br>
    Jan 14 08:38:07 data2 kernel: [4895298.502405] drbd r0: conn(
    NetworkFailure -&gt; Unconnected ) <br>
    Jan 14 08:38:07 data2 kernel: [4895298.502406] drbd r0: receiver
    terminated<br>
    Jan 14 08:38:07 data2 kernel: [4895298.502408] drbd r0: Restarting
    receiver thread<br>
    Jan 14 08:38:07 data2 kernel: [4895298.502409] drbd r0: receiver
    (re)started<br>
    Jan 14 08:38:07 data2 kernel: [4895298.502415] drbd r0: conn(
    Unconnected -&gt; WFConnection ) <br>
    Jan 14 08:38:07 data2 kernel: [4895299.002586] drbd r0: Handshake
    successful: Agreed network protocol version 101<br>
    Jan 14 08:38:07 data2 kernel: [4895299.002592] drbd r0: Agreed to
    support TRIM on protocol level<br>
    Jan 14 08:38:07 data2 kernel: [4895299.002813] drbd r0: Peer
    authenticated using 20 bytes HMAC<br>
    Jan 14 08:38:07 data2 kernel: [4895299.002848] drbd r0: conn(
    WFConnection -&gt; WFReportParams ) <br>
    Jan 14 08:38:07 data2 kernel: [4895299.002852] drbd r0: Starting
    asender thread (from drbd_r_r0 [3400])<br>
    <br>
    It would reconnect, sync, and disconnect again. I stopped the node,
    checked the hardware (all seems fine), rebooted and tried to start
    drbd again:<br>
    <br>
    root@data2:/var/log# drbdadm connect r0<br>
    r0: Failure: (158) Unknown resource<br>
    additional info from kernel:<br>
    unknown resource<br>
    Command 'drbdsetup-84 connect r0 ipv4:172.16.0.2:7789
    ipv4:172.16.0.1:7789 --max-epoch-size=8000 --max-buffers=8000
    --sndbuf-size=0 --after-sb-2pri=disconnect
    --after-sb-1pri=disconnect --after-sb-0pri=disconnect
    --shared-secret=1e69dc721fd2e65368ae3ba1e5929979 --verify-alg=sha1
    --cram-hmac-alg=sha1 --protocol=C' terminated with exit code 10<br>
    <br>
    My resource is:<br>
    <br>
    resource r0 {<br>
        on data1 {<br>
             device     /dev/drbd0;<br>
             disk       /dev/sda1;<br>
             address    ipv4 172.16.0.1:7789;<br>
             meta-disk  internal;<br>
        }<br>
        on data2 {<br>
             device    /dev/drbd0;<br>
             disk      /dev/sda1;<br>
             address   ipv4 172.16.0.2:7789;<br>
             meta-disk internal;<br>
        }<br>
    }<br>
    <br>
    And yes, /dev/sda1 does exist.<br>
    <br>
    I tried different things, I've updated to 8.4.7-1 (It was running
    8.4.5), but I can't get it to work. I'm kind of stuck here - I have
    no idea what is going wrong here. Any help would be greatly
    appreciated.<br>
    <br>
    Kind regards,<br>
    <br>
    Dirk<br>
    <br>
    <br>
    <div class="moz-signature">-- <br>
      <title>ProActive Software</title>
      <link href="http://fonts.googleapis.com/css?family=Lato:700"
        rel="stylesheet" type="text/css">
      <style type="text/css">

html, body, table {
        font-family:                        Lato;
        font-size:                                11px;
}

a {
        color:                                        #25aae1;
        text-decoration:                none;
}

</style><a href="http://www.proactive.nl"><img alt=""
          src="cid:part1.07080204.05070807@proactive.nl" height="49"
          width="170" border="0"></a><br>
      <br>
      <table cellpadding="0" cellspacing="0">
        <tbody>
          <tr>
            <td width="20"><b>T</b></td>
            <td>023 - 5422299</td>
          </tr>
          <tr>
            <td width="20"><b>M</b></td>
            <td>06 - 25078793</td>
          </tr>
          <tr>
            <td width="20"><b>W</b></td>
            <td><a href="http://www.proactive.nl">www.proactive.nl</a></td>
          </tr>
        </tbody>
      </table>
      <br>
      <table cellpadding="0" cellspacing="0">
        <tbody>
          <tr>
            <td><a href="https://twitter.com/ProActive_nl"><img
                  src="cid:part4.04050800.07000100@proactive.nl"
                  alt="Twitter" height="25" width="25" border="0"></a></td>
            <td><a href="http://www.youtube.com/user/ProActiveSoftware"><img
                  src="cid:part6.00040503.04090109@proactive.nl"
                  alt="YouTube" height="25" width="25" border="0"></a></td>
          </tr>
        </tbody>
      </table>
    </div>
  </body>
</html>