you mean like this?<br><br><span class="q">lab-test-01 <a onclick="return top.js.OpenExtLink(window,event,this)" href="http://192.168.10.218/" target="_blank">192.168.10.218</a> drbddisk::r0 Filesystem::/dev/drbd0::/mysql::ext3 drbddisk::r1 Filesystem::/dev/drbd1::/data::ext3
</span><br><br>I&#39;ll do this and run it again, and post the debug. the weird thing is the debug says it releases the IP resource, but it never actually does.<br>it says &quot;success&quot; &quot;success&quot; but doesn&#39;t actually do anything.
<br>here&#39;s a portion of the ha-log:<br><br>ResourceManager[32348]: 2007/06/13_12:45:08 info: Running /etc/ha.d/resource.d/Filesystem /dev/drbd1 /data ext3 stop<br>Filesystem[32683]:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2007/06/13_12:45:08 INFO: Running stop for /dev/drbd1 on /data
<br>Filesystem[32678]:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2007/06/13_12:45:08 INFO:&nbsp; Success<br>ResourceManager[32348]: 2007/06/13_12:45:08 info: Running /etc/ha.d/resource.d/Filesystem /dev/drbd0 /mysql ext3 stop<br>Filesystem[32731]:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2007/06/13_12:45:08 INFO: Running stop for /dev/drbd0 on /mysql
<br>Filesystem[32726]:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2007/06/13_12:45:08 INFO:&nbsp; Success<br>ResourceManager[32348]: 2007/06/13_12:45:08 info: Running /etc/ha.d/resource.d/drbddisk r1 stop<br>ResourceManager[32348]: 2007/06/13_12:45:08 info: Running /etc/ha.d/resource.d/drbddisk r0 stop
<br>ResourceManager[32348]: 2007/06/13_12:45:08 info: Running /etc/ha.d/resource.d/IPaddr <a href="http://192.168.100.218">192.168.100.218</a> stop<br>IPaddr[371]:&nbsp;&nbsp;&nbsp; 2007/06/13_12:45:08 INFO: /sbin/ifconfig eth0:0 <a href="http://192.168.100.218">
192.168.100.218</a> down<br>IPaddr[360]:&nbsp;&nbsp;&nbsp; 2007/06/13_12:45:08 INFO:&nbsp; Success<br>mach_down[32328]:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2007/06/13_12:45:08 info: /usr/lib/heartbeat/mach_down: nice_failback: foreign resources acquired<br>mach_down[32328]:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2007/06/13_12:45:08 info: mach_down takeover complete for node lab-test-nag01.
<br>heartbeat[32257]: 2007/06/13_12:45:08 info: mach_down takeover complete.<br>heartbeat[32257]: 2007/06/13_12:45:13 info: Local Resource acquisition completed. (none)<br>heartbeat[32257]: 2007/06/13_12:45:13 info: local resource transition completed.
<br>hb_standby[421]:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2007/06/13_12:45:38 Going standby [foreign].<br>heartbeat[32257]: 2007/06/13_12:45:38 info: lab-test-nag02 wants to go standby [foreign]<br>heartbeat[32257]: 2007/06/13_12:45:49 WARN: No reply to standby request.&nbsp; Standby request cancelled
<br><br>BTW I use auto-failback for a specific reason - you always know which one is the primary. That is, if your servers are in a remote location, managed by different group, and you want to do maintenance, you can be reasonably sure it&#39;s ok to remove the secondary from service.
<br>But it&#39;s just a thought, not totally critical.<br><br>the ha-debug is way too huge to post. I could send attached, off-list. recommend?<br><br>Dan.<br><div><span class="gmail_quote"><br>On 6/14/07, <b class="gmail_sendername">
Lars Ellenberg</b> &lt;<a href="mailto:lars.ellenberg@linbit.com">lars.ellenberg@linbit.com</a>&gt; wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
On Thu, Jun 14, 2007 at 10:37:38AM -0400, Dan Gahlinger wrote:<br>&gt; I posted this in linux-ha but got no response, and didn&#39;t even see my post get<br>&gt; to the list.<br>&gt; so here it is here. seems more like a drbd issue anyhow.
<br>&gt;<br>&gt; I have two systems, with heartbeat and DRBD installed.<br>&gt; Initially I tested with just DRBD, and was able to fail back and forth very<br>&gt; well and easily.<br>&gt;<br>&gt; However, when using heartbeat, it won&#39;t fail over, no matter what I do. status
<br>&gt; doesn&#39;t change.<br>&gt;<br>&gt; I have it setup so that DRBD goes over a cross-over cable between the two<br>&gt; systems on a private IP.<br>&gt; and heartbeat is run over the public (internet facing) interfaces.
<br>&gt;<br>&gt; My heartbeat config looks like this:<br>&gt;<br>&gt; vi /etc/ha.d/ha.cf -<br>&gt; logfacility local0<br>&gt;<br>&gt; logfile /var/log/ha-log<br>&gt;<br>&gt; debugfile /var/log/ha-debug<br>&gt;<br>&gt; udpport 694
<br>&gt;<br>&gt; keepalive 1<br>&gt;<br>&gt; deadtime 60<br>&gt;<br>&gt; bcast eth0<br>&gt;<br>&gt; node LAB-TEST-01<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ^^^^^^^^^^^^ [1]<br>&gt;<br>&gt; node LAB-TEST-02<br>&gt;<br>&gt; auto_failback on<br><br>I don&#39;t like automatic failback.
<br><br>it may even be dangerous<br>(in case you have some misbehaving resource agent on stop ...<br>if you don&#39;t know what I mean, consider yourself happy<br>to have missed out on one of the most fun parts setting up
<br>a heartbeat cluster)<br><br>in a &quot;homogeneous&quot; 2-node-failover-cluster<br>(i.e. both nodes are more or less identical)<br>it does not make much sense.<br><br>and to have a non-homogeneous cluster is<br>not a good idea either (most of the time).
<br><br>even then, operator will get paged for the first failover,<br>and if deemd useful, will initiate the switch-back by hand.<br><br>&gt; and /etc/ha.d/haresources (note IP address is the virtual public IP):<br><br>( this is all one long single line, right?
<br>&nbsp;&nbsp;if not, you _have_ to use backslash! )<br>&gt; lab-test-01 <a href="http://192.168.10.218">192.168.10.218</a> drbddisk Filesystem::/dev/drbd0::/mysql::ext3 Filesystem::/dev/drbd1::/data::ext3<br>&nbsp;&nbsp;^^^^^^^^^^^ [1]&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;^^^^^^^^[2]
<br><br>[1] should be the same cAsE (preferably both small).<br>&nbsp;&nbsp;&nbsp;&nbsp;it must be the actual node name, as reported by &quot;uname -n&quot;<br>[2] please use one drbddisk statement per drbd resource explicitly.<br>&nbsp;&nbsp;&nbsp;&nbsp;drbddisk::r0 drbddisk::r1
<br>&nbsp;&nbsp;&nbsp;&nbsp;(or whatever your resource names are in drbd.conf)<br><br>&gt; configs on both systems are the same, hosts files identical with all<br>&gt; the entries.&nbsp;&nbsp;I&#39;ve tried with auto_failback on and off seems to make<br>
&gt; no difference.<br>&gt;<br>&gt; I test by pulling the public cable on lab-test-01, or using ifconfig eth0 down<br>&gt;<br>&gt; Also, when I bring the server back up drbd can&#39;t see the other system<br>&gt; (either one), it becomes
<br>&gt; secondary/unknown and primary/unknown.<br>&gt;<br>&gt; It seems for some cases I need to use the drbdadm primary all on the<br>&gt; primary at boot up to fix that.<br>&gt; One other note about the heartbeat issue above. I found if I enter the
<br>&gt; commands manually it seems to work.<br>&gt; which makes it really weird.<br>&gt;<br>&gt; Can anyone tell me what&#39;s going wrong?<br><br>the heartneat log file(s) (ha-debug)?<br><br><br>--<br>: Lars Ellenberg&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Tel +43-1-8178292-0&nbsp;&nbsp;:
<br>: LINBIT Information Technologies GmbH&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Fax +43-1-8178292-82 :<br>: Vivenotgasse 48, A-1120 Vienna/Europe&nbsp;&nbsp;&nbsp;&nbsp;<a href="http://www.linbit.com">http://www.linbit.com</a> :<br>__<br>please use the &quot;List-Reply&quot; function of your email client.
<br>_______________________________________________<br>drbd-user mailing list<br><a href="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</a><br><a href="http://lists.linbit.com/mailman/listinfo/drbd-user">http://lists.linbit.com/mailman/listinfo/drbd-user
</a><br></blockquote></div><br>