<html dir="ltr"><head></head><body style="text-align:left; direction:ltr;"><div>Hi All,</div><div><br></div><div>Can anyone help me on the "PingAck did not arrive in time." repeated error while initial bitmap synchronization? First time it happened after I updated our cluster with the latest centos and drbd updates. I'm using the basic drbd configuration on 527TB LVM volume, replicated on 2 nodes with cross-over 100Gbps connection. The same connection is used for Pacemaker without any problems. I don't see any network adapter errors in logs, no reconnects or packets drop when the error happens for drbd. I've also tried another adapter with 10Gbps direct cable connection and got the same error.</div><div><br></div><pre><font size="1"><b># rpm -q centos-release</b></font></pre><pre><font size="1"><b><br></b></font></pre><pre><font size="1">centos-release-7-6.1810.2.el7.centos.x86_64</font></pre><pre><font size="1"><br></font></pre><pre><font size="1"><b># yum list installed | grep drbd</b></font></pre><pre><font size="1"><b><br></b></font></pre><pre><font size="1">drbd90-utils.x86_64                           9.6.0-1.el7.elrepo       @elrepo  </font></pre><pre><font size="1">kmod-drbd90.x86_64                            9.0.16-1.el7_6.elrepo    @elrepo  </font></pre><pre></pre><div><br></div><pre><font size="1"><b># ifconfig</b></font></pre><pre><font size="1"><br></font></pre><pre><font size="1">ens2: flags=4163&lt;UP,BROADCAST,RUNNING,MULTICAST&gt;&nbsp;&nbsp;mtu 1500</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;inet 172.16.1.1&nbsp;&nbsp;netmask 255.255.255.255&nbsp;&nbsp;broadcast 172.16.1.1</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;ether b8:83:03:67:3f:d4&nbsp;&nbsp;txqueuelen 1000&nbsp;&nbsp;(Ethernet)</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;RX packets 63547&nbsp;&nbsp;bytes 11147564 (10.6 MiB)</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;RX errors 0&nbsp;&nbsp;dropped 0&nbsp;&nbsp;overruns 0&nbsp;&nbsp;frame 0</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;TX packets 265307&nbsp;&nbsp;bytes 33045583 (31.5 MiB)</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;TX errors 0&nbsp;&nbsp;dropped 0 overruns 0&nbsp;&nbsp;carrier 0&nbsp;&nbsp;collisions 0</font></pre><pre><font size="1"><br></font></pre><pre><font size="1"><br></font></pre><pre><font size="1">eno8: flags=4163&lt;UP,BROADCAST,RUNNING,MULTICAST&gt;&nbsp;&nbsp;mtu 1500</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;inet 172.20.1.1&nbsp;&nbsp;netmask 255.255.0.0&nbsp;&nbsp;broadcast 172.20.255.255</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;ether 20:67:7c:1c:42:c6&nbsp;&nbsp;txqueuelen 1000&nbsp;&nbsp;(Ethernet)</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;RX packets 484&nbsp;&nbsp;bytes 49086 (47.9 KiB)</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;RX errors 0&nbsp;&nbsp;dropped 0&nbsp;&nbsp;overruns 0&nbsp;&nbsp;frame 0</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;TX packets 504&nbsp;&nbsp;bytes 56974 (55.6 KiB)</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;TX errors 0&nbsp;&nbsp;dropped 0 overruns 0&nbsp;&nbsp;carrier 0&nbsp;&nbsp;collisions 0</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;device interrupt 116&nbsp;&nbsp;memory 0xe3000000-e37fffff&nbsp;&nbsp;</font></pre><div><br></div><pre><font size="1"><b># drbdadm dump all</b></font></pre><pre><font size="1"><b><br></b></font></pre><pre><font size="1"># /etc/drbd.conf</font></pre><pre><font size="1">global {</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;usage-count no;</font></pre><pre><font size="1">}</font></pre><pre><font size="1"><br></font></pre><pre><font size="1">common {</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;options {</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;auto-promote&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;yes;</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;}</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;net {</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;protocol&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;C;</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;}</font></pre><pre><font size="1">}</font></pre><pre><font size="1"><br></font></pre><pre><font size="1"># resource r0 on sgpplhan01: not ignored, not stacked</font></pre><pre><font size="1"># defined at /etc/drbd.d/r0.res:1</font></pre><pre><font size="1">resource r0 {</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;volume 0 {</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;device&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;/dev/drbd0 minor 0;</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;disk&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;/dev/storage/data;</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;meta-disk&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;internal;</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;}</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;on sgpplhan01 {</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;node-id 0;</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;address&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;ipv4 172.16.1.1:7788;</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;}</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;on sgpplhan02 {</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;node-id 1;</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;address&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;ipv4 172.16.2.1:7788;</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;}</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;net {</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;after-sb-0pri&nbsp;&nbsp;&nbsp;&nbsp;discard-zero-changes;</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;after-sb-1pri&nbsp;&nbsp;&nbsp;&nbsp;consensus;</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;after-sb-2pri&nbsp;&nbsp;&nbsp;&nbsp;disconnect;</font></pre><pre><font size="1">&nbsp;&nbsp;&nbsp;&nbsp;}</font></pre><pre><font size="1">}</font></pre><div></div><div><br></div><pre><font size="1"><b># dmesg | grep drbd</b></font></pre><pre><font size="1"><b><br></b></font></pre><pre><font size="1">[37259.335235] drbd r0/0 drbd0 sgpplhan02: drbd_sync_handshake:</font></pre><pre><font size="1">[37259.335245] drbd r0/0 drbd0 sgpplhan02: self 0000000000000004:0000000000000000:0000000000000000:0000000000000000 bits:141608532581 flags:24</font></pre><pre><font size="1">[37259.335254] drbd r0/0 drbd0 sgpplhan02: peer B7DA5A657F09CD92:45B54292B9CBC0CF:0000000000000000:0000000000000000 bits:141608532581 flags:20</font></pre><pre><font size="1">[37259.335260] drbd r0/0 drbd0 sgpplhan02: uuid_compare()=-3 by rule 20</font></pre><pre><font size="1">[37259.335265] drbd r0/0 drbd0 sgpplhan02: Writing the whole bitmap, full sync required after drbd_sync_handshake.</font></pre><pre><font size="1">[37265.754528] drbd r0/0 drbd0 sgpplhan02: pdsk( DUnknown -&gt; UpToDate ) repl( Off -&gt; WFBitMapT )</font></pre><pre><font size="1">[37265.754546] drbd r0/0 drbd0: Resumed AL updates</font></pre><pre><font size="1">[37279.780140] drbd r0 sgpplhan02: PingAck did not arrive in time.</font></pre><pre><font size="1">[37279.781303] drbd r0 sgpplhan02: conn( Connected -&gt; NetworkFailure ) peer( Primary -&gt; Unknown )</font></pre><pre><font size="1">[37279.781313] drbd r0/0 drbd0 sgpplhan02: pdsk( UpToDate -&gt; DUnknown ) repl( WFBitMapT -&gt; Off )</font></pre><pre><font size="1">[37279.781371] drbd r0 sgpplhan02: ack_receiver terminated</font></pre><pre><font size="1">[37279.781376] drbd r0 sgpplhan02: Terminating ack_recv thread</font></pre><pre><font size="1">[37279.833051] drbd r0 sgpplhan02: Connection closed</font></pre><pre><font size="1">[37279.833069] drbd r0 sgpplhan02: conn( NetworkFailure -&gt; Unconnected )</font></pre><pre><font size="1">[37279.833086] drbd r0 sgpplhan02: Restarting receiver thread</font></pre><pre><font size="1">[37279.833098] drbd r0 sgpplhan02: conn( Unconnected -&gt; Connecting )</font></pre><pre><font size="1">[37308.171618] drbd r0 sgpplhan02: Handshake to peer 1 successful: Agreed network protocol version 114</font></pre><pre><font size="1">[37308.171628] drbd r0 sgpplhan02: Feature flags enabled on protocol level: 0xf TRIM THIN_RESYNC WRITE_SAME WRITE_ZEROES.</font></pre><pre><font size="1">[37308.171666] drbd r0 sgpplhan02: Starting ack_recv thread (from drbd_r_r0 [28699])</font></pre><pre><font size="1">[37308.217846] drbd r0: Preparing cluster-wide state change 686534516 (0-&gt;1 499/146)</font></pre><pre><font size="1">[37308.218242] drbd r0: State change 686534516: primary_nodes=2, weak_nodes=FFFFFFFFFFFFFFFC</font></pre><pre><font size="1">[37308.218253] drbd r0: Committing cluster-wide state change 686534516 (0ms)</font></pre><pre><font size="1">[37308.218296] drbd r0 sgpplhan02: conn( Connecting -&gt; Connected ) peer( Unknown -&gt; Primary )</font></pre><pre><font size="1">[37308.222753] drbd r0/0 drbd0 sgpplhan02: drbd_sync_handshake:</font></pre><pre><font size="1">[37308.222763] drbd r0/0 drbd0 sgpplhan02: self 0000000000000004:0000000000000000:0000000000000000:0000000000000000 bits:141608532581 flags:124</font></pre><pre><font size="1">[37308.222771] drbd r0/0 drbd0 sgpplhan02: peer B7DA5A657F09CD92:45B54292B9CBC0CF:0000000000000000:0000000000000000 bits:141608532581 flags:120</font></pre><pre><font size="1">[37308.222777] drbd r0/0 drbd0 sgpplhan02: uuid_compare()=-3 by rule 20</font></pre><pre><font size="1">[37308.222782] drbd r0/0 drbd0 sgpplhan02: Writing the whole bitmap, full sync required after drbd_sync_handshake.</font></pre><pre><font size="1">[37314.890717] drbd r0/0 drbd0 sgpplhan02: pdsk( DUnknown -&gt; UpToDate ) repl( Off -&gt; WFBitMapT )</font></pre><pre><font size="1">[37328.669598] drbd r0 sgpplhan02: PingAck did not arrive in time.</font></pre><pre><font size="1">[37328.670759] drbd r0 sgpplhan02: conn( Connected -&gt; NetworkFailure ) peer( Primary -&gt; Unknown )</font></pre><pre><font size="1">[37328.670770] drbd r0/0 drbd0 sgpplhan02: pdsk( UpToDate -&gt; DUnknown ) repl( WFBitMapT -&gt; Off )</font></pre><pre><font size="1">[37328.670823] drbd r0 sgpplhan02: ack_receiver terminated</font></pre><pre><font size="1">[37328.670828] drbd r0 sgpplhan02: Terminating ack_recv thread</font></pre><pre><font size="1">[37328.718096] drbd r0 sgpplhan02: Connection closed</font></pre><pre><font size="1">[37328.718112] drbd r0 sgpplhan02: conn( NetworkFailure -&gt; Unconnected )</font></pre><pre><font size="1">[37328.718127] drbd r0 sgpplhan02: Restarting receiver thread</font></pre><pre><font size="1">[37328.718138] drbd r0 sgpplhan02: conn( Unconnected -&gt; Connecting )</font></pre><pre><font size="1">[37351.755553] drbd r0 sgpplhan02: conn( Connecting -&gt; Disconnecting )</font></pre><pre><font size="1">[37351.794081] drbd r0 sgpplhan02: Connection closed</font></pre><pre><font size="1"><br></font></pre><pre><br></pre><div><br></div><pre></pre><div></div>
</body></html>