<div dir="ltr"><div>Hi,</div><div><br></div><div>Please check.</div><div><br></div><div>Ver:</div><div>  - drbd-9.0.1-1</div><div>  - CentOS 7</div><div><br></div><div>Env:</div><div>  - 4 nodes configured but used 3 nodes only</div><div> - sync(C) replication mode.</div><div>  - VM network bandwith: 100Mbps(slow)</div><div><br></div><div>Test:</div><div> 01) setup node1, 2, 3, UpToDate all</div><div> 02) node1: primary</div><div> 03) node1: mount /dev/drbd1  /mnt</div><div> 04) node1: copy 1Gfile /mnt ( it takes 2 and half minutes)</div><div> 05) during copy</div><div> 06) node2: disconnect </div><div> 07) node3: down</div><div> 08) node2: connect </div><div> 09) node3: up</div><div> 10) node2: changed from Connecting to Standalone</div><div> 11) node2: disconnect again</div><div> 12) node2: connect again</div><div> 13) node2: changed to normal Connected status(2nd connect try is successful.)</div><div><br></div><div>Notes:</div><div> -  Check please node2 log at the time of Test-10) step</div><div> </div><div>34378 Feb 27 15:32:52 drbd9-02 kernel: drbd r0 drbd9-01: conn( Unconnected -&gt; Connecting )</div><div>34379 Feb 27 15:32:52 drbd9-02 kernel: drbd r0 tcp:drbd9-01: initial packet S crossed</div><div>34380 Feb 27 15:32:53 drbd9-02 kernel: drbd r0 drbd9-01: Handshake successful: Agreed network protocol version 111</div><div>34381 Feb 27 15:32:53 drbd9-02 kernel: drbd r0 drbd9-01: Feature flags enabled on protocol level: 0x7 TRIM THIN_RESYNC WRITE_SAME.</div><div>34382 Feb 27 15:32:53 drbd9-02 kernel: drbd r0 drbd9-01: Starting ack_recv thread (from drbd_r_r0 [6617])</div><div>34383 Feb 27 15:32:53 drbd9-02 kernel: drbd r0 drbd9-01: meta connection shut down by peer.</div><div>34384 Feb 27 15:32:53 drbd9-02 kernel: drbd r0 drbd9-01: conn( Connecting -&gt; NetworkFailure )</div><div>34385 Feb 27 15:32:53 drbd9-02 kernel: drbd r0 drbd9-01: ack_receiver terminated</div><div>34386 Feb 27 15:32:53 drbd9-02 kernel: drbd r0 drbd9-01: Terminating ack_recv thread</div><div>34387 Feb 27 15:32:53 drbd9-02 kernel: drbd r0 drbd9-01: sock was shut down by peer</div><div>34388 Feb 27 15:32:53 drbd9-02 kernel: drbd r0 drbd9-01: Connection closed</div><div>34389 Feb 27 15:32:53 drbd9-02 kernel: drbd r0 drbd9-01: conn( NetworkFailure -&gt; Unconnected )</div><div>34390 Feb 27 15:32:53 drbd9-02 kernel: drbd r0 drbd9-01: Restarting receiver thread</div><div>34391 Feb 27 15:32:53 drbd9-02 kernel: drbd r0 drbd9-01: conn( Unconnected -&gt; Connecting )</div><div>34392 Feb 27 15:32:54 drbd9-02 kernel: drbd r0 tcp:drbd9-01: initial packet S crossed</div><div>34393 Feb 27 15:32:55 drbd9-02 kernel: drbd r0 drbd9-01: Handshake successful: Agreed network protocol version 111</div><div>34394 Feb 27 15:32:55 drbd9-02 kernel: drbd r0 drbd9-01: Feature flags enabled on protocol level: 0x7 TRIM THIN_RESYNC WRITE_SAME.</div><div>34395 Feb 27 15:32:55 drbd9-02 kernel: drbd r0 drbd9-01: Starting ack_recv thread (from drbd_r_r0 [6617])</div><div>34396 Feb 27 15:32:55 drbd9-02 kernel: drbd r0 drbd9-01: Preparing remote state change 56227800 (primary_nodes=0, weak_nodes=0)</div><div>34397 Feb 27 15:33:25 drbd9-02 kernel: drbd r0: Two-phase commit 56227800 timeout</div><div>34398 Feb 27 15:33:46 drbd9-02 kernel: drbd r0/0 drbd1: peer does not support WRITE_SAME</div><div>34399 Feb 27 15:33:46 drbd9-02 kernel: drbd r0/0 drbd1 drbd9-01: drbd_sync_handshake:</div><div>34400 Feb 27 15:33:46 drbd9-02 kernel: drbd r0/0 drbd1 drbd9-01: self E22074C65B6BE5A2:0000000000000000:15F5D43C9A0B7F26:351C9E61C6B06FB6 bits:0 flags:0</div><div>34401 Feb 27 15:33:46 drbd9-02 kernel: drbd r0/0 drbd1 drbd9-01: peer 4784B438C8271CE9:E22074C65B6BE5A2:15F5D43C9A0B7F26:0000000000000000 bits:427126 flags:120</div><div>34402 Feb 27 15:33:46 drbd9-02 kernel: drbd r0/0 drbd1 drbd9-01: uuid_compare()=-2 by rule 50</div><div>34403 Feb 27 15:33:46 drbd9-02 kernel: drbd r0: State change failed: Need a connection to start verify or resync</div><div>34404 Feb 27 15:33:46 drbd9-02 kernel: drbd r0 drbd9-01: Failed: conn( Connecting -&gt; Connected ) peer( Unknown -&gt; Primary )</div><div>34405 Feb 27 15:33:46 drbd9-02 kernel: drbd r0/0 drbd1 drbd9-01: Failed: pdsk( DUnknown -&gt; UpToDate ) repl( Off -&gt; WFBitMapT )</div><div>34406 Feb 27 15:33:46 drbd9-02 kernel: drbd r0 drbd9-01: conn( Connecting -&gt; Disconnecting )</div><div>34407 Feb 27 15:33:46 drbd9-02 kernel: drbd r0 drbd9-01: error receiving P_STATE, e: -5 l: 0!</div><div>34408 Feb 27 15:33:46 drbd9-02 kernel: drbd r0 drbd9-01: ack_receiver terminated</div><div>34409 Feb 27 15:33:46 drbd9-02 kernel: drbd r0 drbd9-01: Terminating ack_recv thread</div><div>34410 Feb 27 15:33:46 drbd9-02 kernel: drbd r0 drbd9-01: Connection closed</div><div>34411 Feb 27 15:33:46 drbd9-02 kernel: drbd r0 drbd9-01: conn( Disconnecting -&gt; StandAlone )</div><div>34412 Feb 27 15:33:46 drbd9-02 kernel: drbd r0 drbd9-01: Terminating receiver thread</div><div>34413 Feb 27 15:33:49 drbd9-02 kernel: drbd r0 tcp:drbd9-05: Closing unexpected connection from 100.100.10.11</div><div>34414 Feb 27 15:33:55 drbd9-02 kernel: drbd r0 tcp:drbd9-05: Closing unexpected connection from 100.100.10.11</div><div>34415 Feb 27 15:34:04 drbd9-02 kernel: drbd r0 tcp:drbd9-05: Closing unexpected connection from 100.100.10.11</div><div>34416 Feb 27 15:34:15 drbd9-02 kernel: drbd r0 tcp:drbd9-05: Closing unexpected connection from 100.100.10.11</div><div>34417 Feb 27 15:34:26 drbd9-02 kernel: drbd r0 tcp:drbd9-05: Closing unexpected connection from 100.100.10.11</div><div>34418 Feb 27 15:34:36 drbd9-02 kernel: drbd r0 tcp:drbd9-05: Closing unexpected connection from 100.100.10.11</div><div>34419 Feb 27 15:34:47 drbd9-02 kernel: drbd r0/0 drbd1 drbd9-03: unexpected</div><div><br></div><div><br></div><div>Let me attach full log files here:</div><div> - node1: <a href="http://pastebin.com/BbUGy2Yn">http://pastebin.com/BbUGy2Yn</a></div><div> - node2: <a href="http://pastebin.com/2z7auSA2">http://pastebin.com/2z7auSA2</a></div><div> - node3: <a href="http://pastebin.com/jn5JLg1P">http://pastebin.com/jn5JLg1P</a></div><div><br></div><div>Please see my comments interspersed in above log files.</div><div><br></div><div>I think the first disconnect-connect step(Test-06,Test-08) on node2 is normal.</div><div>Nevertheless, node2 was changed to not &quot;Connected&quot; but &quot;Standalone&quot; after uuid_compare.</div><div>Why?</div><div><br></div><div><br></div><div>Thanks.</div><div><br></div><div><br></div>
</div>