<div dir="ltr"><div dir="ltr"><div>Hi, <br></div><div></div><br></div><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">... . Satellite and Controller are<br>
deployed using docker and are version 1.2.0. The Satellites are started<br>
using the &quot;--net=host --privileged&quot; options for docker.<br></blockquote><div><br></div><div>That sounds like the first problem here. Multiple docker containers still share the same kernel. As DRBD is a kernel module, all of your docker containers will share basically the same DRBD, but will try to configure it differently. <br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
I was able to successfully add the satellite nodes to the controller and<br>
create a resource group, volume group and an initial resource with<br>
place-count=1.<br></blockquote><div><br></div><div>Sure, with only 1 container using DRBD all works fine.<br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
I then deleted the resource, resource definition and resource group and<br>
re-created the group but this time with place-count=2.<br></blockquote><div><br></div><div>This is where the trouble begins :)<br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
Finally I created a new volume and this the the command used &quot;linstor<br>
resource-group spawn-resources group1 res1 20G&quot; just hung. After a while<br>
I hit Ctrl+C and looked at the resource list which looked like this:<br>
<br>
╭───────────────────────────────────────────────────────────╮<br>
┊ ResourceName ┊ Node        ┊ Port ┊ Usage  ┊        State ┊<br>
╞═══════════════════════════════════════════════════════════╡<br>
┊ res1         ┊ storagesat1 ┊ 7000 ┊ Unused ┊     UpToDate ┊<br>
┊ res1         ┊ storagesat2 ┊ 7000 ┊ Unused ┊ Inconsistent ┊<br>
╰───────────────────────────────────────────────────────────╯<br>
<br>
In the satellite logs I see this on all three satellite nodes (but with<br>
different report numbers in each case):<br>
16:24:50.767 [DeviceManager] ERROR LINSTOR/Satellite - SYSTEM -<br>
com.linbit.linstor.storage.StorageException: Failed to find major:minor<br>
of device /dev/drbd1000 [Report number 5DB85E9C-8A7C3-000001]<br></blockquote><div><br></div><div>I admit, we might want to look into this, even in such a case the command should not hang or freeze. We should report an error all the way back to the client.</div><div>However, if you&#39;d look into the ErrorReport (using &quot;linstor err show 5DB85E9C-8A7C3-000001&quot;) you&#39;d see what the cause of the message &quot;Failed to find major:minor of device ...&quot; was. This error message is triggered by a call to &quot;stat -L -c %t:%T $devicePath&quot;. Although that alone might not be very useful, I am pretty sure that the standard out and standard error messages of that external command (which are also included in the ErrorReport) will surely point you in the right direction. <br></div><div>However, it is also useful to know that the ErrorReport ids are $sessionNumber-$nodeNameHash-$incrementalNumber. Which means, you might also want to look into the previous ErrorReport 5DB85E9C-8A7C3-000000. This might be an ErrorReport about drbd failing to adjust the /dev/drbd1000 device, because of.. well.. the shared kernel... <br></div><div></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
The device node exists on all three nodes and looks identical:<br>
# ls -l /dev/drbd1000<br>
brw-rw---- 1 root disk 147, 1000 Oct 29 17:24 /dev/drbd1000<br></blockquote><div><br></div><div>Still the same issue. If you repeat your scenario with only 1 satellite, where everything worked well, you should still see in ALL docker containers the /dev/drbd1000 (as well as on the host itself). <br></div><div> <br clear="all"></div></div>-- <br><div dir="ltr" class="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div>Best regards,<br></div>Gabor Hernadi<br></div></div></div></div></div>