<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">

<head>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-7">


<meta name=Generator content="Microsoft Word 12 (filtered medium)">
<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri","sans-serif";
        color:windowtext;}
..MsoChpDefault
        {mso-style-type:export-only;}
@page Section1
        {size:612.0pt 792.0pt;
        margin:72.0pt 90.0pt 72.0pt 90.0pt;}
div.Section1
        {page:Section1;}
-->
</style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
</head>

<body lang=EL link=blue vlink=purple>

<div class=Section1>

<p class=MsoNormal><span lang=EN-US>Hello all<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span lang=EN-US>I have a two nodes cluster on Centos 5.2,
kernel 2.6.18-92.1.22.el5.centos.plus, drbd-8.3.0-3 and drbd-km-2.6.18_92.1.22.el5.centos.plus-8.3.0-3
compiled and installed as rpm by myself.<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span lang=EN-US>Though I do have two GigabitEth NICs
connected back-to-back for DRBD and clustering, from time to time, especially during
heavy traffic on the public GigEth interfaces of the cluster nodes, I get the
following:<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0: PingAck did not arrive in time.<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0: peer( Primary -&gt; Unknown ) conn(
Connected -&gt; NetworkFailure ) pdsk( UpToDate -&gt; DUnknown ) susp( 0 -&gt;
1 )<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0: asender terminated<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0: Terminating asender thread<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0: short read expecting header on sock:
r=-512<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0: Creating new current UUID<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0: Connection closed<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0: helper command: /sbin/drbdadm
fence-peer minor-0<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0: helper command: /sbin/drbdadm
fence-peer minor-0 exit code 2 (0x200)<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0: fence-peer helper broken, returned 2<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0: Considering state change from bad
state. Error would be: 'Refusing to be Primary while peer is not outdated'<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0:  old = { cs:NetworkFailure ro:Primary/Unknown
ds:UpToDate/DUnknown s--- }<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0:  new = { cs:Unconnected
ro:Primary/Unknown ds:UpToDate/DUnknown s--- }<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0: conn( NetworkFailure -&gt;
Unconnected )<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0: receiver terminated<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0: Restarting receiver thread<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0: receiver (re)started<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0: Considering state change from bad
state. Error would be: 'Refusing to be Primary while peer is not outdated'<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0:  old = { cs:Unconnected
ro:Primary/Unknown ds:UpToDate/DUnknown s--- }<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0:  new = { cs:WFConnection
ro:Primary/Unknown ds:UpToDate/DUnknown s--- }<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd0: conn( Unconnected -&gt; WFConnection
)<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1: PingAck did not arrive in time.<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1: peer( Primary -&gt; Unknown ) conn(
Connected -&gt; NetworkFailure ) pdsk( UpToDate -&gt; DUnknown ) susp( 0 -&gt;
1 )<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1: asender terminated<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1: Terminating asender thread<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1: short read expecting header on sock:
r=-512<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1: Creating new current UUID<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1: Connection closed<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1: helper command: /sbin/drbdadm
fence-peer minor-1<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1: helper command: /sbin/drbdadm
fence-peer minor-1 exit code 2 (0x200)<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1: fence-peer helper broken, returned 2<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1: Considering state change from bad
state. Error would be: 'Refusing to be Primary while peer is not outdated'<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1:  old = { cs:NetworkFailure
ro:Primary/Unknown ds:UpToDate/DUnknown s--- }<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1:  new = { cs:Unconnected
ro:Primary/Unknown ds:UpToDate/DUnknown s--- }<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1: conn( NetworkFailure -&gt;
Unconnected )<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1: receiver terminated<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1: Restarting receiver thread<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1: receiver (re)started<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1: Considering state change from bad
state. Error would be: 'Refusing to be Primary while peer is not outdated'<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1:  old = { cs:Unconnected
ro:Primary/Unknown ds:UpToDate/DUnknown s--- }<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1:  new = { cs:WFConnection
ro:Primary/Unknown ds:UpToDate/DUnknown s--- }<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>drbd1: conn( Unconnected -&gt; WFConnection
)<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span lang=EN-US>Fencing is working since the node that
failed to send the PinkAck gets fenced (and rebooted).<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>However, any ideas why this is happening since
there is private link for DRBD?<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US>The machines are AMD X2 2GHz with 4GB Ram
each.<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span lang=EN-US>Also I fail to identify on the man pages
and the on-line tutorial/manual, the parameters that will make me fine tune
this behavior, so I would also appreciate some help on that too.<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span lang=EN-US>Thank you all for your time.<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span lang=EN-US>Theophanis Kontogiannis<o:p></o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>

<p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>

</div>

</body>

</html>