<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 TRANSITIONAL//EN">
<HTML>
<HEAD>
  <META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=UTF-8">
  <META NAME="GENERATOR" CONTENT="GtkHTML/3.26.3">
</HEAD>
<BODY>
Hello all,<BR>
<BR>
I have two nodes cluster CentOS 5.4, self compiled drbd-8.3.5-3 against kernel 2.6.18-164.6.1.el5.<BR>
<BR>
The cluster runs drbd resources in primary/primary<BR>
<BR>
However always on tweety1, drbd2 (almost all of the times) and drbd0&amp;1 (some times) the resources do not get promoted.<BR>
<BR>
following are kernel messages on tweety1 for the last event related to r2:<BR>
<BR>
block drbd2: Starting worker thread (from cqueue/0 [183])<BR>
block drbd2: disk( Diskless -&gt; Attaching ) <BR>
block drbd2: Found 6 transactions (276 active extents) in activity log.<BR>
block drbd2: Method to ensure write ordering: barrier<BR>
block drbd2: max_segment_size ( = BIO size ) = 32768<BR>
block drbd2: drbd_bm_resize called with capacity == 1953460304<BR>
block drbd2: resync bitmap: bits=244182538 words=3815353<BR>
block drbd2: size = 931 GB (976730152 KB)<BR>
block drbd2: recounting of set bits took additional 70 jiffies<BR>
block drbd2: 0 KB (0 bits) marked out-of-sync by on disk bit-map.<BR>
block drbd2: disk( Attaching -&gt; Outdated ) pdsk( DUnknown -&gt; Outdated ) <BR>
block drbd2: conn( StandAlone -&gt; Unconnected ) <BR>
block drbd2: Starting receiver thread (from drbd2_worker [2746])<BR>
block drbd2: receiver (re)started<BR>
block drbd2: conn( Unconnected -&gt; WFConnection ) <BR>
block drbd2: Handshake successful: Agreed network protocol version 91<BR>
block drbd2: Peer authenticated using 20 bytes of 'sha1' HMAC<BR>
block drbd2: conn( WFConnection -&gt; WFReportParams ) <BR>
block drbd2: Starting asender thread (from drbd2_receiver [2766])<BR>
block drbd2: data-integrity-alg: &lt;not-used&gt;<BR>
block drbd2: drbd_sync_handshake:<BR>
block drbd2: self 9CFD298D943949EE:0000000000000000:9C3AD9517D750E0D:8A45AE63D53852DB bits:0 flags:0<BR>
block drbd2: peer E3BC1675D02BC8BD:9CFD298D943949EF:9C3AD9517D750E0D:8A45AE63D53852DB bits:127 flags:0<BR>
block drbd2: uuid_compare()=-1 by rule 50<BR>
block drbd2: peer( Unknown -&gt; Primary ) conn( WFReportParams -&gt; WFBitMapT ) pdsk( Outdated -&gt; UpToDate ) <BR>
block drbd2: conn( WFBitMapT -&gt; WFSyncUUID ) <BR>
block drbd2: helper command: /sbin/drbdadm before-resync-target minor-2<BR>
block drbd2: helper command: /sbin/drbdadm before-resync-target minor-2 exit code 0 (0x0)<BR>
block drbd2: conn( WFSyncUUID -&gt; SyncTarget ) disk( Outdated -&gt; Inconsistent ) <BR>
block drbd2: Began resync as SyncTarget (will sync 508 KB [127 bits set]).<BR>
block drbd2: Resync done (total 1 sec; paused 0 sec; 508 K/sec)<BR>
block drbd2: conn( SyncTarget -&gt; Connected ) disk( Inconsistent -&gt; UpToDate ) <BR>
block drbd2: helper command: /sbin/drbdadm after-resync-target minor-2<BR>
block drbd2: helper command: /sbin/drbdadm after-resync-target minor-2 exit code 0 (0x0)<BR>
block drbd2: peer( Primary -&gt; Secondary ) <BR>
block drbd2: peer( Secondary -&gt; Unknown ) conn( Connected -&gt; TearDown ) pdsk( UpToDate -&gt; DUnknown ) <BR>
block drbd2: meta connection shut down by peer.<BR>
block drbd2: asender terminated<BR>
block drbd2: Terminating asender thread<BR>
block drbd2: Connection closed<BR>
block drbd2: conn( TearDown -&gt; Unconnected ) <BR>
block drbd2: receiver terminated<BR>
block drbd2: Restarting receiver thread<BR>
block drbd2: receiver (re)started<BR>
block drbd2: conn( Unconnected -&gt; WFConnection ) <BR>
block drbd2: Handshake successful: Agreed network protocol version 91<BR>
block drbd2: Peer authenticated using 20 bytes of 'sha1' HMAC<BR>
block drbd2: conn( WFConnection -&gt; WFReportParams ) <BR>
block drbd2: Starting asender thread (from drbd2_receiver [2766])<BR>
block drbd2: data-integrity-alg: &lt;not-used&gt;<BR>
block drbd2: drbd_sync_handshake:<BR>
block drbd2: self E3BC1675D02BC8BC:0000000000000000:F05089B922FCC908:9CFD298D943949EF bits:0 flags:0<BR>
block drbd2: peer E3BC1675D02BC8BC:0000000000000000:F05089B922FCC908:9CFD298D943949EF bits:0 flags:0<BR>
block drbd2: uuid_compare()=0 by rule 40<BR>
block drbd2: peer( Unknown -&gt; Secondary ) conn( WFReportParams -&gt; Connected ) pdsk( DUnknown -&gt; UpToDate ) <BR>
block drbd2: peer( Secondary -&gt; Primary )<BR>
<BR>
<BR>
and on tweety2<BR>
<BR>
block drbd2: Starting worker thread (from cqueue/0 [183])<BR>
block drbd2: disk( Diskless -&gt; Attaching ) <BR>
block drbd2: Found 6 transactions (276 active extents) in activity log.<BR>
block drbd2: Method to ensure write ordering: barrier<BR>
block drbd2: max_segment_size ( = BIO size ) = 32768<BR>
block drbd2: drbd_bm_resize called with capacity == 1953460304<BR>
block drbd2: resync bitmap: bits=244182538 words=3815353<BR>
block drbd2: size = 931 GB (976730152 KB)<BR>
block drbd2: recounting of set bits took additional 70 jiffies<BR>
block drbd2: 0 KB (0 bits) marked out-of-sync by on disk bit-map.<BR>
block drbd2: disk( Attaching -&gt; Outdated ) pdsk( DUnknown -&gt; Outdated ) <BR>
block drbd2: conn( StandAlone -&gt; Unconnected ) <BR>
block drbd2: Starting receiver thread (from drbd2_worker [2746])<BR>
block drbd2: receiver (re)started<BR>
block drbd2: conn( Unconnected -&gt; WFConnection ) <BR>
block drbd2: Handshake successful: Agreed network protocol version 91<BR>
block drbd2: Peer authenticated using 20 bytes of 'sha1' HMAC<BR>
block drbd2: conn( WFConnection -&gt; WFReportParams ) <BR>
block drbd2: Starting asender thread (from drbd2_receiver [2766])<BR>
block drbd2: data-integrity-alg: &lt;not-used&gt;<BR>
block drbd2: drbd_sync_handshake:<BR>
block drbd2: self 9CFD298D943949EE:0000000000000000:9C3AD9517D750E0D:8A45AE63D53852DB bits:0 flags:0<BR>
block drbd2: peer E3BC1675D02BC8BD:9CFD298D943949EF:9C3AD9517D750E0D:8A45AE63D53852DB bits:127 flags:0<BR>
block drbd2: uuid_compare()=-1 by rule 50<BR>
block drbd2: peer( Unknown -&gt; Primary ) conn( WFReportParams -&gt; WFBitMapT ) pdsk( Outdated -&gt; UpToDate ) <BR>
block drbd2: conn( WFBitMapT -&gt; WFSyncUUID ) <BR>
block drbd2: helper command: /sbin/drbdadm before-resync-target minor-2<BR>
block drbd2: helper command: /sbin/drbdadm before-resync-target minor-2 exit code 0 (0x0)<BR>
block drbd2: conn( WFSyncUUID -&gt; SyncTarget ) disk( Outdated -&gt; Inconsistent ) <BR>
block drbd2: Began resync as SyncTarget (will sync 508 KB [127 bits set]).<BR>
block drbd2: Resync done (total 1 sec; paused 0 sec; 508 K/sec)<BR>
block drbd2: conn( SyncTarget -&gt; Connected ) disk( Inconsistent -&gt; UpToDate ) <BR>
block drbd2: helper command: /sbin/drbdadm after-resync-target minor-2<BR>
block drbd2: helper command: /sbin/drbdadm after-resync-target minor-2 exit code 0 (0x0)<BR>
block drbd2: peer( Primary -&gt; Secondary ) <BR>
block drbd2: peer( Secondary -&gt; Unknown ) conn( Connected -&gt; TearDown ) pdsk( UpToDate -&gt; DUnknown ) <BR>
block drbd2: meta connection shut down by peer.<BR>
block drbd2: asender terminated<BR>
block drbd2: Terminating asender thread<BR>
block drbd2: Connection closed<BR>
block drbd2: conn( TearDown -&gt; Unconnected ) <BR>
block drbd2: receiver terminated<BR>
block drbd2: Restarting receiver thread<BR>
block drbd2: receiver (re)started<BR>
block drbd2: conn( Unconnected -&gt; WFConnection ) <BR>
block drbd2: Handshake successful: Agreed network protocol version 91<BR>
block drbd2: Peer authenticated using 20 bytes of 'sha1' HMAC<BR>
block drbd2: conn( WFConnection -&gt; WFReportParams ) <BR>
block drbd2: Starting asender thread (from drbd2_receiver [2766])<BR>
block drbd2: data-integrity-alg: &lt;not-used&gt;<BR>
block drbd2: drbd_sync_handshake:<BR>
block drbd2: self E3BC1675D02BC8BC:0000000000000000:F05089B922FCC908:9CFD298D943949EF bits:0 flags:0<BR>
block drbd2: peer E3BC1675D02BC8BC:0000000000000000:F05089B922FCC908:9CFD298D943949EF bits:0 flags:0<BR>
block drbd2: uuid_compare()=0 by rule 40<BR>
block drbd2: peer( Unknown -&gt; Secondary ) conn( WFReportParams -&gt; Connected ) pdsk( DUnknown -&gt; UpToDate ) <BR>
block drbd2: peer( Secondary -&gt; Primary )<BR>
<BR>
<BR>
<BR>
my drbd.conf is:<BR>
<BR>
<BR>
global {<BR>
&nbsp;&nbsp;&nbsp; # minor-count 64;<BR>
<BR>
&nbsp;&nbsp;&nbsp; # dialog-refresh 5; # 5 seconds<BR>
<BR>
&nbsp;&nbsp;&nbsp; # disable-ip-verification;<BR>
<BR>
&nbsp;&nbsp;&nbsp; usage-count yes;<BR>
}<BR>
<BR>
<BR>
<BR>
common {<BR>
<BR>
&nbsp; protocol C;<BR>
<BR>
&nbsp; syncer {<BR>
<BR>
&nbsp;&nbsp;&nbsp; rate 100M;<BR>
<BR>
&nbsp;&nbsp;&nbsp; #after &quot;r2&quot;;<BR>
&nbsp;&nbsp;&nbsp; al-extents 257;<BR>
&nbsp; }<BR>
&nbsp; <BR>
handlers {<BR>
&nbsp;&nbsp;&nbsp; <BR>
<BR>
&nbsp;&nbsp;&nbsp; pri-on-incon-degr &quot;echo b &gt; /proc/sysrq-trigger ; reboot -f&quot;;<BR>
&nbsp;&nbsp;&nbsp; pri-lost-after-sb &quot;echo b &gt; /proc/sysrq-trigger ; reboot -f&quot;;<BR>
&nbsp;&nbsp;&nbsp; local-io-error &quot;echo o &gt; /proc/sysrq-trigger ; halt -f&quot;;<BR>
<BR>
<BR>
&nbsp;&nbsp;&nbsp; outdate-peer &quot;/sbin/obliterate&quot;;<BR>
<BR>
&nbsp;&nbsp;&nbsp; pri-lost &quot;echo pri-lost. Have a look at the log files. | mail -s 'DRBD Alert' root; echo b &gt; /proc/sysrq-trigger ; reboot -f&quot;;<BR>
<BR>
&nbsp;&nbsp;&nbsp; split-brain &quot;echo split-brain. drbdadm -- --discard-my-data connect $DRBD_RESOURCE ? | mail -s 'DRBD Alert' root&quot;;<BR>
<BR>
&nbsp; }<BR>
<BR>
&nbsp; startup {<BR>
&nbsp;&nbsp;&nbsp;&nbsp; wfc-timeout&nbsp; 60;<BR>
<BR>
&nbsp;&nbsp;&nbsp; degr-wfc-timeout 60;&nbsp;&nbsp;&nbsp; # 1 minutes.<BR>
&nbsp;&nbsp;&nbsp; #wait-after-sb;<BR>
<BR>
&nbsp;&nbsp;&nbsp; outdated-wfc-timeout 30;<BR>
<BR>
&nbsp;&nbsp;&nbsp; become-primary-on both;<BR>
<BR>
&nbsp; }<BR>
<BR>
&nbsp; disk {<BR>
&nbsp;&nbsp;&nbsp; #on-io-error&nbsp;&nbsp; pass-on;<BR>
<BR>
&nbsp;&nbsp;&nbsp; fencing resource-and-stonith;<BR>
&nbsp;&nbsp;&nbsp; # size 10G;<BR>
&nbsp; }<BR>
<BR>
&nbsp; net {<BR>
&nbsp;&nbsp;&nbsp; <BR>
&nbsp;&nbsp;&nbsp;&nbsp; sndbuf-size 512k;<BR>
<BR>
&nbsp;&nbsp;&nbsp;&nbsp; timeout&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 60;&nbsp;&nbsp;&nbsp; #&nbsp; 6 seconds&nbsp; (unit = 0.1 seconds)<BR>
&nbsp;&nbsp;&nbsp;&nbsp; connect-int&nbsp;&nbsp; 10;&nbsp;&nbsp;&nbsp; # 10 seconds&nbsp; (unit = 1 second)<BR>
&nbsp;&nbsp;&nbsp;&nbsp; ping-int&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 10;&nbsp;&nbsp;&nbsp; # 10 seconds&nbsp; (unit = 1 second)<BR>
&nbsp;&nbsp;&nbsp;&nbsp; ping-timeout&nbsp; 50;&nbsp;&nbsp;&nbsp; # 500 ms (unit = 0.1 seconds)<BR>
<BR>
&nbsp;&nbsp;&nbsp;&nbsp; max-buffers&nbsp;&nbsp;&nbsp;&nbsp; 2048;<BR>
<BR>
&nbsp;&nbsp;&nbsp; # unplug-watermark&nbsp;&nbsp; 128;<BR>
&nbsp;&nbsp;&nbsp;&nbsp; max-epoch-size&nbsp; 2048;<BR>
&nbsp;&nbsp;&nbsp;&nbsp; ko-count 10;<BR>
<BR>
&nbsp;&nbsp;&nbsp; allow-two-primaries;<BR>
<BR>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; cram-hmac-alg &quot;*****&quot;;<BR>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; shared-secret &quot;*****&quot;;<BR>
&nbsp;&nbsp;&nbsp; after-sb-0pri discard-least-changes;<BR>
&nbsp;&nbsp;&nbsp; #after-sb-0pri discard-younger-primary;<BR>
&nbsp;&nbsp;&nbsp; #after-sb-0pri discard-older-primary;<BR>
<BR>
&nbsp;&nbsp;&nbsp; after-sb-1pri violently-as0p;<BR>
<BR>
&nbsp;&nbsp;&nbsp; after-sb-2pri violently-as0p;<BR>
&nbsp;&nbsp;&nbsp; rr-conflict call-pri-lost;<BR>
<BR>
<BR>
#&nbsp;&nbsp;&nbsp; data-integrity-alg &quot;crc32c&quot;;<BR>
<BR>
&nbsp; }<BR>
<BR>
<BR>
}<BR>
<BR>
<BR>
resource r0 {<BR>
<BR>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; device&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /dev/drbd0;<BR>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; disk&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /dev/hda4;<BR>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; meta-disk&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; internal;<BR>
<BR>
on tweety-1 { address&nbsp;&nbsp; 10.254.254.253:7788; }<BR>
<BR>
on tweety-2 { address&nbsp;&nbsp; 10.254.254.254:7788; }<BR>
<BR>
}<BR>
<BR>
resource r1 {<BR>
<BR>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; device&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /dev/drbd1;<BR>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; disk&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; /dev/hdb4;<BR>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; meta-disk&nbsp;&nbsp;&nbsp;&nbsp; internal;<BR>
<BR>
&nbsp; on tweety-1 { address&nbsp; 10.254.254.253:7789; }<BR>
<BR>
&nbsp; on tweety-2 { address&nbsp; 10.254.254.254:7789; }<BR>
}<BR>
<BR>
resource r2 {<BR>
<BR>
device /dev/drbd2;<BR>
disk /dev/sda1;<BR>
meta-disk internal;<BR>
<BR>
&nbsp; on tweety-1 { address&nbsp; 10.254.254.253:7790; }<BR>
<BR>
&nbsp; on tweety-2 { address&nbsp; 10.254.254.254:7790; }<BR>
}<BR>
<BR>
<BR>
<BR>
'drbdadm primary r2', promotes the resource to primary without problem.<BR>
<BR>
<BR>
Am I doing something wrong?<BR>
<BR>
Thank you All for any help.<BR>
<BR>
Theophanis Kontogiannis<BR>
<BR>
</BODY>
</HTML>