<p dir="ltr"><br>
On 11/12/2015 4:40 PM, &quot;Digimer&quot; &lt;<a href="mailto:lists@alteeve.ca">lists@alteeve.ca</a>&gt; wrote:<br>
&gt;<br>
&gt; On 11/12/15 12:12 AM, Igor Cicimov wrote:<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; On Fri, Dec 11, 2015 at 3:08 AM, Digimer &lt;<a href="mailto:lists@alteeve.ca">lists@alteeve.ca</a><br>
&gt; &gt; &lt;mailto:<a href="mailto:lists@alteeve.ca">lists@alteeve.ca</a>&gt;&gt; wrote:<br>
&gt; &gt;<br>
&gt; &gt;     On 10/12/15 09:27 AM, Fabrizio Zelaya wrote:<br>
&gt; &gt;     &gt; Thank you Lars and Adam for your recommendations.<br>
&gt; &gt;     &gt;<br>
&gt; &gt;     &gt; I have ping-timeout set to 5 and it still happened.<br>
&gt; &gt;     &gt;<br>
&gt; &gt;     &gt; Lars with this fencing idea. I have been contemplating this, however I<br>
&gt; &gt;     &gt; am rebuilding servers which are already in place,  All the configuration<br>
&gt; &gt;     &gt; related to cman and drbd  was literally copied and pasted from the old<br>
&gt; &gt;     &gt; servers.<br>
&gt; &gt;<br>
&gt; &gt;     You can hook DRBD into cman&#39;s fencing with the rhch_fence fence handler,<br>
&gt; &gt;     which is included with DRBD. This assumes, of course, that you have<br>
&gt; &gt;     cman&#39;s fencing configured properly.<br>
&gt; &gt;<br>
&gt; &gt;     &gt; Is this concept of having dual-primary without fencing being a<br>
&gt; &gt;     &gt; mis-configuration something new?<br>
&gt; &gt;<br>
&gt; &gt;     No, but it is often overlooked.<br>
&gt; &gt;<br>
&gt; &gt;     &gt; I ask this because as you would imagine by now, the old servers are<br>
&gt; &gt;     &gt; working with the exact same configuration and have no problems at all.<br>
&gt; &gt;     &gt; And while your idea makes perfect sense it would also make sense to have<br>
&gt; &gt;     &gt; the exact same problem on every version of drbd.<br>
&gt; &gt;<br>
&gt; &gt;     Fencing is like a seatbelt. You can drive for years never needing it,<br>
&gt; &gt;     but when you do, it saves you from hitting the windshield.<br>
&gt; &gt;<br>
&gt; &gt;     Fencing is 100% needed, and all the more so with dual-primary.<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; So this practically excludes the DRBD usage in the public clouds like<br>
&gt; &gt; AWS, right? Here shutting down the peer&#39;s power supply is impossible and<br>
&gt; &gt; using the CLI has no guarantee that shutting down a peer VM will ever<br>
&gt; &gt; happen since has to be done via the network. Even if the VM&#39;s have<br>
&gt; &gt; multiple network interfaces provisioned for redundancy in different<br>
&gt; &gt; subnets they are still virtual and there is possibility they end up on<br>
&gt; &gt; the same physical interface on the hypervisor host which has failed (or<br>
&gt; &gt; it&#39;s switch), causing the split brain in the first place.<br>
&gt;<br>
&gt; As much as I may personally think that public clouds are not good<br>
&gt; platforms for HA...<br>
&gt;<br>
&gt; No, AWS is possible to use. There is a fence agent called (I believe)<br>
&gt; fence_ec2 <br>
Yep that agent exists although it might create some security issues due to the permissions needed to run the API CLI calls (ssh key, certificate, iam role, etc) on the VM so it might not be an option for everyone.</p>
<p dir="ltr">that works by requesting an instance be terminated and then<br>
&gt; waiting for the confirmation of that task completing. You would<br>
&gt; configure this in cluster.conf and then hook DRBD into it by using<br>
&gt; &#39;fence-handler &quot;/path/to/rhcs_fence&quot;;&#39; and &#39;fencing-policy<br>
&gt; &quot;resource-and-stonith&quot;;&#39;. Then, if a node is lost, DRBD will block and<br>
&gt; ask cman to fence the node, and wait for a success message.<br>
&gt;<br>
&gt; All the other things you mention are reasons why I personally don&#39;t<br>
&gt; consider the cloud a good platform, but it is used. For me, I insist on<br>
&gt; dual fence methods; First using IPMI and, if that fails, falling back to<br>
&gt; a pair of switched PDUs to cut the (redundant) PSUs off.<br>
Yeah no such goodies in ec2 :-)</p>
<p dir="ltr">&gt;<br>
&gt; &gt;     &gt; There is a difference to be consider I guess. I am now installing this<br>
&gt; &gt;     &gt; servers using SL6 as you saw in my original email, the old servers are<br>
&gt; &gt;     &gt; working with Debian 6.0.7<br>
&gt; &gt;     &gt;<br>
&gt; &gt;     &gt; The old servers are running  drbd8-utils  2:8.3.7-2.1<br>
&gt; &gt;<br>
&gt; &gt;     --<br>
&gt; &gt;     Digimer<br>
&gt; &gt;     Papers and Projects: <a href="https://alteeve.ca/w/">https://alteeve.ca/w/</a><br>
&gt; &gt;     What if the cure for cancer is trapped in the mind of a person without<br>
&gt; &gt;     access to education?<br>
&gt; &gt;     _______________________________________________<br>
&gt; &gt;     drbd-user mailing list<br>
&gt; &gt;     <a href="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</a> &lt;mailto:<a href="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</a>&gt;<br>
&gt; &gt;     <a href="http://lists.linbit.com/mailman/listinfo/drbd-user">http://lists.linbit.com/mailman/listinfo/drbd-user</a><br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt;<br>
&gt;<br>
&gt; --<br>
&gt; Digimer<br>
&gt; Papers and Projects: <a href="https://alteeve.ca/w/">https://alteeve.ca/w/</a><br>
&gt; What if the cure for cancer is trapped in the mind of a person without<br>
&gt; access to education?<br>
</p>