A little more info:<div><br></div><div>If I set the the node with the good disk to primary, then write 100MB to the drbd volume, the drbd node with the bad disk calls my handler successfully, detaches and does not hang. It seems to only hang when I change the node with the bad disk&#39;s role to Primary.</div>

<div><br><br><div class="gmail_quote">On Thu, Apr 12, 2012 at 9:40 AM, Chris Dickson <span dir="ltr">&lt;<a href="mailto:chrisd1100@gmail.com">chrisd1100@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

<div>Thanks Lars, dmesg indeed reported the exit code of 0:</div><div><br></div><div>[  332.733554] block drbd575: role( Secondary -&gt; Primary )</div><div>[  332.772827] block drbd575: disk( UpToDate -&gt; Failed )</div>


<div>[  332.772840] block drbd575: Local IO failed in __req_mod. Detaching...</div><div>[  332.772925] block drbd575: helper command: /sbin/drbdadm local-io-error minor-575</div><div>[  332.790163] block drbd575: helper command: /sbin/drbdadm local-io-error minor-575 exit code 0 (0x0)</div>


<div>[  332.790189] block drbd575: disk( Failed -&gt; Diskless )</div><div>[  332.803862] block drbd575: receiver updated UUIDs to effective data uuid: 2B81D15C3E0ADD80</div><div><br></div><div>The peer node is also locked up, all operations report:</div>


<div><br></div><div>r575: State change failed: (-10) State change was refused by peer node</div><div><br></div><div>One question on 8.3.latest, one of the reasons I wanted to use 8.4 was the support for more minor numbers. It&#39;s not that I necessarily need more than 256 on one machine, but the way my numbering system works it makes it nice to be able to assign minor numbers greater than 255. Is there a quick hack somewhere in the source that I can increase this limit or is this a more complex change made for 8.4?</div>


<div><br></div><div>Also the prefer-remote read balancing method is something that I was interested in, but not super necessary.</div><div><br></div><div>Thanks,</div><div><br></div><div>Chris</div><div class="HOEnZb"><div class="h5">

<br><div class="gmail_quote">
On Thu, Apr 12, 2012 at 9:24 AM, Lars Ellenberg <span dir="ltr">&lt;<a href="mailto:lars.ellenberg@linbit.com" target="_blank">lars.ellenberg@linbit.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">


<div>On Thu, Apr 12, 2012 at 09:14:38AM -0400, Chris Dickson wrote:<br>
&gt; Thanks for the quick reply,<br>
&gt;<br>
&gt; My test handler currently isn&#39;t doing anything interesting, I just had it<br>
&gt; echo &#39;hello world&#39; to a file which is located on a different drive than the<br>
&gt; LVM volume. The echo seems to have completed successfully as the file is<br>
&gt; written.<br>
&gt;<br>
&gt; The end goal for the handler is to simply insert a row into a remote DB,<br>
&gt; other than that the default behavior on io-error of detaching is exactly<br>
&gt; what I would like to have happen.<br>
&gt;<br>
&gt; I just tried filtering out drbd in lvm.conf and that doesn&#39;t seem to be the<br>
&gt; issue. After another try I did a quick ps auxf this showed up:<br>
&gt;<br>
&gt; root       340  0.0  0.0  21392  1284 ?        Ss   12:59   0:00 udevd<br>
&gt; --daemon<br>
&gt; root       415  0.0  0.0  21384   896 ?        S    12:59   0:00  \_ udevd<br>
&gt; --daemon<br>
&gt; root      1775  0.0  0.0   8448   724 ?        D    13:04   0:00  |   \_<br>
&gt; /sbin/blkid -o udev -p /dev/drbd575<br>
&gt;<br>
&gt; So it seems like udev is initiating the blkid call, could it be doing this<br>
&gt; before drbd has finished executing the handler?<br>
<br>
</div>If the handler finished,<br>
(drbd prints &quot;... helper command .... exit code ...&quot; to the kernel log).<br>
there is no reason for anything to hang.<br>
<br>
DRBD is supposed to retry failed local requests on the peer, and if that<br>
is not possible (no connection, or no good remote disk either), either<br>
freeze IO (if so configured) or report IO errors back up the stack.<br>
<br>
&quot;Supposed to just work&quot;.<br>
<br>
Maybe rather downgrade to 8.3.latest, I know we fixed some issues<br>
in the retry logic on the way to 8.4.not-yet-but-&quot;soon&quot;-to-be-released.2<br>
<div><div><br>
--<br>
: Lars Ellenberg<br>
: LINBIT | Your Way to High Availability<br>
: DRBD/HA support and consulting <a href="http://www.linbit.com" target="_blank">http://www.linbit.com</a><br>
_______________________________________________<br>
drbd-user mailing list<br>
<a href="mailto:drbd-user@lists.linbit.com" target="_blank">drbd-user@lists.linbit.com</a><br>
<a href="http://lists.linbit.com/mailman/listinfo/drbd-user" target="_blank">http://lists.linbit.com/mailman/listinfo/drbd-user</a><br>
</div></div></blockquote></div><br>
</div></div></blockquote></div><br></div>