<html><body><div style="color:#000; background-color:#fff; font-family:Courier New, courier, monaco, monospace, sans-serif;font-size:10pt">Regarding the TCP sockets (or lack thereof): I found this in the ring buffer after putting SAN2 into standby mode (and causing the cluster to promote r1 [to primary] on SAN1):<br><br>san1:~ # dmesg | grep '\[ 53'<br>[ 5329.349289] block drbd1000: role( Secondary -&gt; Primary ) <br>[ 5329.360252] block drbd1001: role( Secondary -&gt; Primary ) <br>[ 5329.379071] block drbd1002: role( Secondary -&gt; Primary ) <br>[ 5329.426989] block drbd1003: role( Secondary -&gt; Primary ) <br>[ 5343.319014] d-con r1: conn( StandAlone -&gt; Unconnected ) <br>[ 5343.319047] d-con r1: Starting receiver thread (from drbd_w_r1 [5058])<br>[ 5343.319589] d-con r1: receiver (re)started<br>[ 5343.319629] d-con r1: conn( Unconnected -&gt; WFConnection ) <br>[ 5345.785122] d-con r1: Handshake successful: Agreed network protocol version
 100<br>[ 5345.785281] d-con r1: conn( WFConnection -&gt; WFReportParams ) <br>[ 5345.785444] d-con r1: Starting asender thread (from drbd_r_r1 [1002])<br>[ 5345.808072] block drbd1000: drbd_sync_handshake:<br>[ 5345.808081] block drbd1000: self E624A5F197121811:701073FA8F926E0E:B8DFF1CE13CF5A28:B8DEF1CE13CF5A29 bits:0 flags:0<br>[ 5345.808088] block drbd1000: peer 221AECCC2A594D3A:701073FA8F926E0E:B8DFF1CE13CF5A29:B8DEF1CE13CF5A29 bits:0 flags:0<br>[ 5345.808095] block drbd1000: uuid_compare()=100 by rule 90<br>[ 5345.808103] block drbd1000: helper command: /sbin/drbdadm initial-split-brain minor-1000<br>[ 5345.810730] block drbd1000: helper command: /sbin/drbdadm initial-split-brain minor-1000 exit code 0 (0x0)<br>[ 5345.810752] block drbd1000: Split-Brain detected but unresolved, dropping connection!<br>[ 5345.810761] block drbd1000: helper command: /sbin/drbdadm split-brain minor-1000<br>[ 5345.813274] block drbd1000: helper command: /sbin/drbdadm
 split-brain minor-1000 exit code 0 (0x0)<br>[ 5345.813330] d-con r1: conn( WFReportParams -&gt; Disconnecting ) <br>[ 5345.813337] d-con r1: error receiving ReportState, e: -5 l: 0!<br>[ 5345.813357] d-con r1: asender terminated<br>[ 5345.813364] d-con r1: Terminating asender thread<br>[ 5345.815601] d-con r1: Connection closed<br>[ 5345.816401] d-con r1: conn( Disconnecting -&gt; StandAlone ) <br>[ 5345.816409] d-con r1: receiver terminated<br>[ 5345.816413] d-con r1: Terminating receiver thread<br>[ 5345.825972] iscsi_trgt: iscsi_volume_del(319) 2 3<br>[ 5345.878586] iscsi_trgt: iscsi_volume_del(319) 2 2<br>[ 5345.929437] iscsi_trgt: iscsi_volume_del(319) 2 1<br>[ 5345.980288] iscsi_trgt: iscsi_volume_del(319) 2 0<br>[ 5345.996109] d-con r0: Handshake successful: Agreed network protocol version 100<br>[ 5345.996227] d-con r0: conn( WFConnection -&gt; WFReportParams ) <br>[ 5345.996233] d-con r0: Starting asender thread (from drbd_r_r0 [5099])<br>[
 5346.008801] d-con r0: meta connection shut down by peer.<br>[ 5346.008844] d-con r0: conn( WFReportParams -&gt; NetworkFailure ) <br>[ 5346.008849] d-con r0: asender terminated<br>[ 5346.008854] d-con r0: Terminating asender thread<br>[ 5346.020959] d-con r0: Connection closed<br>[ 5346.021320] d-con r0: conn( NetworkFailure -&gt; Unconnected ) <br>[ 5346.021326] d-con r0: receiver terminated<br>[ 5346.021329] d-con r0: Restarting receiver thread<br>[ 5346.021333] d-con r0: receiver (re)started<br>[ 5346.021362] d-con r0: conn( Unconnected -&gt; WFConnection ) <br>[ 5346.099104] block drbd1000: role( Primary -&gt; Secondary ) <br>[ 5346.099149] block drbd1000: bitmap WRITE of 0 pages took 0 jiffies<br>[ 5346.099332] block drbd1000: 0 KB (0 bits) marked out-of-sync by on disk bit-map.<br>[ 5346.118758] block drbd1001: role( Primary -&gt; Secondary ) <br>[ 5346.118814] block drbd1001: bitmap WRITE of 0 pages took 0 jiffies<br>[ 5346.119313] block
 drbd1001: 0 KB (0 bits) marked out-of-sync by on disk bit-map.<br>[ 5346.136762] block drbd1002: role( Primary -&gt; Secondary ) <br>[ 5346.136810] block drbd1002: bitmap WRITE of 0 pages took 0 jiffies<br>[ 5346.137007] block drbd1002: 0 KB (0 bits) marked out-of-sync by on disk bit-map.<br>[ 5346.150667] block drbd1003: role( Primary -&gt; Secondary ) <br>[ 5346.150715] block drbd1003: bitmap WRITE of 0 pages took 0 jiffies<br>[ 5346.150910] block drbd1003: 0 KB (0 bits) marked out-of-sync by on disk bit-map.<br><br>The entries in /var/log/messages are very similar but quite a bit more verbose (~450 lines with cluster messages).<br><br><div><span>HTH,</span></div><div>Eric Pretorious</div><div>Truckee, CA</div><div><br><blockquote style="border-left: 2px solid rgb(16, 16, 255); margin-left: 5px; margin-top: 5px; padding-left: 5px;">  <div style="font-family: Courier New, courier, monaco, monospace, sans-serif; font-size: 10pt;"> <div
 style="font-family: times new roman, new york, times, serif; font-size: 12pt;"> <div dir="ltr"> <font face="Arial" size="2"> <hr size="1">  <b><span style="font-weight:bold;">From:</span></b> Eric &lt;epretorious@yahoo.com&gt;<br> <b><span style="font-weight: bold;">To:</span></b> "drbd-user@lists.linbit.com" &lt;drbd-user@lists.linbit.com&gt; <br> <b><span style="font-weight: bold;">Sent:</span></b> Monday, January 21, 2013 10:32 AM<br> <b><span style="font-weight: bold;">Subject:</span></b> Re: [DRBD-user] Diagnosing a Failed Resource<br> </font> </div> <br><div id="yiv951082656"><div><div style="color:#000;background-color:#fff;font-family:Courier New, courier, monaco, monospace, sans-serif;font-size:10pt;">Thanks, Dan:<br><br>This is what I found in the kernel ring buffer after rebooting both nodes:<br><br>[&nbsp;&nbsp; 75.630608] events: mcg drbd: 3<br>[&nbsp;&nbsp; 75.636697] drbd: initialized. Version: 8.4.1 (api:1/proto:86-100)<br>[&nbsp;&nbsp;
 75.636701] drbd: GIT-hash: 91b4c048c1a0e06777b5f65d312b38d47abaea80 build by phil@fat-tyre, 2011-12-20 12:43:15<br>[&nbsp;&nbsp; 75.636705] drbd: registered as block device major 147<br>[&nbsp;&nbsp; 77.232358] d-con r0: Starting worker thread (from drbdsetup [5455])<br>[&nbsp;&nbsp; 77.233253] block drbd0: disk( Diskless -&gt; Attaching ) <br>[&nbsp;&nbsp; 77.233722] d-con r0: Method to ensure write ordering: flush<br>[&nbsp;&nbsp; 77.233731] block drbd0: max BIO size = 1048576<br>[&nbsp;&nbsp; 77.233742] block drbd0: drbd_bm_resize called with capacity ==
 104868976<br>[&nbsp;&nbsp; 77.234800] block drbd0: resync bitmap: bits=13108622 words=204823 pages=401<br>[&nbsp;&nbsp; 77.234813] block drbd0: size = 50 GB (52434488 KB)<br>[&nbsp;&nbsp; 77.281241] block drbd0: bitmap READ of 401 pages took 12 jiffies<br>[&nbsp;&nbsp; 77.283203] block drbd0: recounting of set bits took additional 0 jiffies<br>[&nbsp;&nbsp; 77.283209] block drbd0: 140 KB (35 bits) marked out-of-sync by on disk bit-map.<br>[&nbsp;&nbsp; 77.283219] block drbd0: disk( Attaching -&gt; UpToDate ) <br>[&nbsp;&nbsp; 77.283224] block drbd0: attached to UUIDs 44A65229313EBE43:BA033E902BDEA3C0:49524878FFCE4B24:49514878FFCE4B25<br>[&nbsp;&nbsp; 77.293056] d-con r1: Starting worker thread (from drbdsetup [5458])<br>[&nbsp;&nbsp; 77.295342] block drbd1000: disk( Diskless -&gt; Attaching ) <br>[&nbsp;&nbsp; 77.296192] d-con r1: Method to ensure write ordering: flush<br>[&nbsp;&nbsp; 77.296208] block drbd1000: max BIO size = 1048576<br>[&nbsp;&nbsp;
 77.296222] block drbd1000: drbd_bm_resize called with capacity == 104868976<br>[&nbsp;&nbsp; 77.297379] block drbd1000: resync bitmap: bits=13108622 words=204823 pages=401<br>[&nbsp;&nbsp; 77.297390] block drbd1000: size = 50 GB (52434488 KB)<br>[&nbsp;&nbsp; 77.342459] block drbd1000: bitmap READ of 401 pages took 11 jiffies<br>[&nbsp;&nbsp; 77.344485] block drbd1000: recounting of set bits took additional 1 jiffies<br>[&nbsp;&nbsp; 77.344491] block drbd1000: 0 KB (0 bits) marked out-of-sync by on disk bit-map.<br>[&nbsp;&nbsp; 77.344502] block drbd1000: disk( Attaching -&gt; UpToDate ) <br>[&nbsp;&nbsp; 77.344507] block drbd1000: attached to UUIDs 221AECCC2A594D3B:701073FA8F926E0E:B8DFF1CE13CF5A29:B8DEF1CE13CF5A29<br>[&nbsp;&nbsp; 77.375446] block drbd1: disk( Diskless -&gt; Attaching ) <br>[&nbsp;&nbsp; 77.380421] block drbd1: max BIO size = 1048576<br>[&nbsp;&nbsp; 77.380429] block drbd1: drbd_bm_resize called with capacity ==
 104868976<br>[&nbsp;&nbsp; 77.381243] block drbd1: resync bitmap: bits=13108622 words=204823 pages=401<br>[&nbsp;&nbsp; 77.381251] block drbd1: size = 50 GB (52434488 KB)<br>[&nbsp;&nbsp; 77.419582] block drbd1: bitmap READ of 401 pages took 9 jiffies<br>[&nbsp;&nbsp; 77.421605] block drbd1: recounting of set bits took additional 1 jiffies<br>[&nbsp;&nbsp; 77.421611] block drbd1: 0 KB (0 bits) marked out-of-sync by on disk bit-map.<br>[&nbsp;&nbsp; 77.421623] block drbd1: disk( Attaching -&gt; UpToDate ) <br>[&nbsp;&nbsp; 77.421628] block drbd1: attached to UUIDs 67FE22C03838CB17:7971B70BBB1F530C:2A4C483084B9C378:2A4B483084B9C379<br>[&nbsp;&nbsp; 77.444507] block drbd1001: disk( Diskless -&gt; Attaching ) <br>[&nbsp;&nbsp; 77.450684] block drbd1001: max BIO size = 1048576<br>[&nbsp;&nbsp; 77.450693] block drbd1001: drbd_bm_resize called with capacity == 104868976<br>[&nbsp;&nbsp; 77.451506] block drbd1001: resync bitmap: bits=13108622 words=204823
 pages=401<br>[&nbsp;&nbsp; 77.451514] block drbd1001: size = 50 GB (52434488 KB)<br>[&nbsp;&nbsp; 77.488711] block drbd1001: bitmap READ of 401 pages took 10 jiffies<br>[&nbsp;&nbsp; 77.491721] block drbd1001: recounting of set bits took additional 0 jiffies<br>[&nbsp;&nbsp; 77.491729] block drbd1001: 0 KB (0 bits) marked out-of-sync by on disk bit-map.<br>[&nbsp;&nbsp; 77.491743] block drbd1001: disk( Attaching -&gt; UpToDate ) <br>[&nbsp;&nbsp; 77.491750] block drbd1001: attached to UUIDs FA58888B061508B7:18C803DDDD8F8404:07D53A5226AD90C1:07D43A5226AD90C1<br>[&nbsp;&nbsp; 77.534563] block drbd2: disk( Diskless -&gt; Attaching ) <br>[&nbsp;&nbsp; 77.546629] block drbd2: max BIO size = 1048576<br>[&nbsp;&nbsp; 77.546642] block drbd2: drbd_bm_resize called with capacity == 52450480<br>[&nbsp;&nbsp; 77.547215] block drbd2: resync bitmap: bits=6556310 words=102443 pages=201<br>[&nbsp;&nbsp; 77.547224] block drbd2: size = 25 GB (26225240
 KB)<br>[&nbsp;&nbsp; 77.573960] block drbd2: bitmap READ of 201 pages took 7 jiffies<br>[&nbsp;&nbsp; 77.575557] block drbd2: recounting of set bits took additional 0 jiffies<br>[&nbsp;&nbsp; 77.575566] block drbd2: 0 KB (0 bits) marked out-of-sync by on disk bit-map.<br>[&nbsp;&nbsp; 77.575580] block drbd2: disk( Attaching -&gt; UpToDate ) <br>[&nbsp;&nbsp; 77.575588] block drbd2: attached to UUIDs 3B55297D5DD31139:3AC323693865E310:AEFA3EE056B21A62:AEF93EE056B21A63<br>[&nbsp;&nbsp; 77.585082] block drbd1002: disk( Diskless -&gt; Attaching ) <br>[&nbsp;&nbsp; 77.593864] block drbd1002: max BIO size = 1048576<br>[&nbsp;&nbsp; 77.593877] block drbd1002: drbd_bm_resize called with capacity == 52450480<br>[&nbsp;&nbsp; 77.594313] block drbd1002: resync bitmap: bits=6556310 words=102443 pages=201<br>[&nbsp;&nbsp; 77.594323] block drbd1002: size = 25 GB (26225240 KB)<br>[&nbsp;&nbsp; 77.625687] block drbd1002: bitmap READ of 201 pages took 8
 jiffies<br>[&nbsp;&nbsp; 77.626621] block drbd1002: recounting of set bits took additional 0 jiffies<br>[&nbsp;&nbsp; 77.626626] block drbd1002: 0 KB (0 bits) marked out-of-sync by on disk bit-map.<br>[&nbsp;&nbsp; 77.626638] block drbd1002: disk( Attaching -&gt; UpToDate ) <br>[&nbsp;&nbsp; 77.626643] block drbd1002: attached to UUIDs CA60CC73DC0B45A5:70A50B0066EC9F38:4F0256C54722763F:4F0156C54722763F<br>[&nbsp;&nbsp; 77.659026] block drbd3: disk( Diskless -&gt; Attaching ) <br>[&nbsp;&nbsp; 77.664455] block drbd3: max BIO size = 1048576<br>[&nbsp;&nbsp; 77.664464] block drbd3: drbd_bm_resize called with capacity == 52450480<br>[&nbsp;&nbsp; 77.664808] block drbd3: resync bitmap: bits=6556310 words=102443 pages=201<br>[&nbsp;&nbsp; 77.664813] block drbd3: size = 25 GB (26225240 KB)<br>[&nbsp;&nbsp; 77.691727] block drbd3: bitmap READ of 201 pages took 6 jiffies<br>[&nbsp;&nbsp; 77.692806] block drbd3: recounting of set bits took additional 1
 jiffies<br>[&nbsp;&nbsp; 77.692812] block drbd3: 0 KB (0 bits) marked out-of-sync by on disk bit-map.<br>[&nbsp;&nbsp; 77.692823] block drbd3: disk( Attaching -&gt; UpToDate ) <br>[&nbsp;&nbsp; 77.692828] block drbd3: attached to UUIDs 29A7176ED176F95F:2698161DF7C4C4E6:F668581CC2EC0F3E:F667581CC2EC0F3F<br>[&nbsp;&nbsp; 77.722193] block drbd1003: disk( Diskless -&gt; Attaching ) <br>[&nbsp;&nbsp; 77.722865] block drbd1003: max BIO size = 1048576<br>[&nbsp;&nbsp; 77.722876] block drbd1003: drbd_bm_resize called with capacity == 52450480<br>[&nbsp;&nbsp; 77.723392] block drbd1003: resync bitmap: bits=6556310 words=102443 pages=201<br>[&nbsp;&nbsp; 77.723402] block drbd1003: size = 25 GB (26225240 KB)<br>[&nbsp;&nbsp; 77.765961] block drbd1003: bitmap READ of 201 pages took 11 jiffies<br>[&nbsp;&nbsp; 77.766888] block drbd1003: recounting of set bits took additional 0 jiffies<br>[&nbsp;&nbsp; 77.766893] block drbd1003: 0 KB (0 bits) marked out-of-sync by on
 disk bit-map.<br>[&nbsp;&nbsp; 77.766905] block drbd1003: disk( Attaching -&gt; UpToDate ) <br>[&nbsp;&nbsp; 77.766910] block drbd1003: attached to UUIDs 18DFC2D8939D73FB:177CEE9681F7C93A:D417E74E9E527B07:D416E74E9E527B07<br>[&nbsp;&nbsp; 77.799304] d-con r0: conn( StandAlone -&gt; Unconnected ) <br>[&nbsp;&nbsp; 77.799341] d-con r0: Starting receiver thread (from drbd_w_r0 [5459])<br>[&nbsp;&nbsp; 77.800720] d-con r1: conn( StandAlone -&gt; Unconnected ) <br>[&nbsp;&nbsp; 77.800778] d-con r1: Starting receiver thread (from drbd_w_r1 [5460])<br>[&nbsp;&nbsp; 77.802795] d-con r0: receiver (re)started<br>[&nbsp;&nbsp; 77.802828] d-con r0: conn( Unconnected -&gt; WFConnection ) <br>[&nbsp;&nbsp; 77.804862] d-con r1: receiver (re)started<br>[&nbsp;&nbsp; 77.804901] d-con r1: conn( Unconnected -&gt; WFConnection ) <br>[&nbsp;&nbsp; 78.161839] block drbd1000: role( Secondary -&gt; Primary ) <br>[&nbsp;&nbsp; 78.180162] block drbd1001: role( Secondary -&gt;
 Primary ) <br>[&nbsp;&nbsp; 78.195287] block drbd1002: role( Secondary -&gt; Primary ) <br>[&nbsp;&nbsp; 78.233303] block drbd1003: role( Secondary -&gt; Primary ) <br>[&nbsp;&nbsp; 78.303485] d-con r0: Handshake successful: Agreed network protocol version 100<br>[&nbsp;&nbsp; 78.303632] d-con r0: conn( WFConnection -&gt; WFReportParams ) <br>[&nbsp;&nbsp; 78.303639] d-con r0: Starting asender thread (from drbd_r_r0 [5519])<br>[&nbsp;&nbsp; 78.303825] d-con r1: Handshake successful: Agreed network protocol version 100<br>[&nbsp;&nbsp; 78.303957] d-con r1: conn( WFConnection -&gt; WFReportParams ) <br>[&nbsp;&nbsp; 78.303964] d-con r1: Starting asender thread (from drbd_r_r1 [5520])<br>[&nbsp;&nbsp; 78.344087] block drbd0: drbd_sync_handshake:<br>[&nbsp;&nbsp; 78.344096] block drbd0: self 44A65229313EBE42:BA033E902BDEA3C0:49524878FFCE4B24:49514878FFCE4B25 bits:35 flags:0<br>[&nbsp;&nbsp; 78.344103] block drbd0: peer
 4B28E699CC1DEE8D:BA033E902BDEA3C0:49524878FFCE4B25:49514878FFCE4B25 bits:814770 flags:2<br>[&nbsp;&nbsp; 78.344111] block drbd0: uuid_compare()=100 by rule 90<br>[&nbsp;&nbsp; 78.344120] block drbd0: helper command: /sbin/drbdadm initial-split-brain minor-0<br>[&nbsp;&nbsp; 78.344168] block drbd1000: drbd_sync_handshake:<br>[&nbsp;&nbsp; 78.344174] block drbd1000: self 221AECCC2A594D3B:701073FA8F926E0E:B8DFF1CE13CF5A29:B8DEF1CE13CF5A29 bits:0 flags:0<br>[&nbsp;&nbsp; 78.344181] block drbd1000: peer E624A5F197121810:701073FA8F926E0E:B8DFF1CE13CF5A28:B8DEF1CE13CF5A29 bits:0 flags:2<br>[&nbsp;&nbsp; 78.344186] block drbd1000: uuid_compare()=100 by rule 90<br>[&nbsp;&nbsp; 78.344192] block drbd1000: helper command: /sbin/drbdadm initial-split-brain minor-1000<br>[&nbsp;&nbsp; 78.348069] d-con r1: meta connection shut down by peer.<br>[&nbsp;&nbsp; 78.348105] d-con r1: conn( WFReportParams -&gt; NetworkFailure ) <br>[&nbsp;&nbsp; 78.348109] d-con r1: asender
 terminated<br>[&nbsp;&nbsp; 78.348113] d-con r1: Terminating asender thread<br>[&nbsp;&nbsp; 78.354965] block drbd1000: helper command: /sbin/drbdadm initial-split-brain minor-1000 exit code 0 (0x0)<br>[&nbsp;&nbsp; 78.355004] block drbd1000: Split-Brain detected but unresolved, dropping connection!<br>[&nbsp;&nbsp; 78.355014] block drbd1000: helper command: /sbin/drbdadm split-brain minor-1000<br>[&nbsp;&nbsp; 78.357534] block drbd0: helper command: /sbin/drbdadm initial-split-brain minor-0 exit code 0 (0x0)<br>[&nbsp;&nbsp; 78.357565] block drbd0: Split-Brain detected but unresolved, dropping connection!<br>[&nbsp;&nbsp; 78.357574] block drbd0: helper command: /sbin/drbdadm split-brain minor-0<br>[&nbsp;&nbsp; 78.363276] block drbd0: helper command: /sbin/drbdadm split-brain minor-0 exit code 0 (0x0)<br>[&nbsp;&nbsp; 78.363330] d-con r0: conn( WFReportParams -&gt; Disconnecting ) <br>[&nbsp;&nbsp; 78.363337] d-con r0: error receiving ReportState, e:
 -5 l: 0!<br>[&nbsp;&nbsp; 78.363804] block drbd1000: helper command: /sbin/drbdadm split-brain minor-1000 exit code 0 (0x0)<br>[&nbsp;&nbsp; 78.363814] d-con r0: asender terminated<br>[&nbsp;&nbsp; 78.363823] d-con r0: Terminating asender thread<br>[&nbsp;&nbsp; 78.363855] d-con r1: conn( NetworkFailure -&gt; Disconnecting ) <br>[&nbsp;&nbsp; 78.363862] d-con r1: error receiving ReportState, e: -5 l: 0!<br>[&nbsp;&nbsp; 78.364193] d-con r0: Connection closed<br>[&nbsp;&nbsp; 78.364217] d-con r0: conn( Disconnecting -&gt; StandAlone ) <br>[&nbsp;&nbsp; 78.364222] d-con r0: receiver terminated<br>[&nbsp;&nbsp; 78.364225] d-con r0: Terminating receiver thread<br>[&nbsp;&nbsp; 78.364420] d-con r1: Connection closed<br>[&nbsp;&nbsp; 78.365199] d-con r1: conn( Disconnecting -&gt; StandAlone ) <br>[&nbsp;&nbsp; 78.365207] d-con r1: receiver terminated<br>[&nbsp;&nbsp; 78.365215] d-con r1: Terminating receiver thread<br><br><div style="color:rgb(0, 0,
 0);font-size:13.3333px;font-family:Courier New, courier, monaco, monospace, sans-serif;background-color:transparent;font-style:normal;"><span>The entry "</span>Split-Brain detected but unresolved, dropping connection!" caught my attention but I'm not sure how to address the split-brain situation if there's no connection between the two nodes. (<span>I checked both nodes' DRBD processes for open TCP sockets and it appears that, at different times, the sockets are in different states. i.e., Sometimes the DRBD process on SAN1 has no sockets open, and other times it has one or both sockets open.) e.g.,</span></div><div style="color:rgb(0, 0, 0);font-size:13.3333px;font-family:Courier New, courier, monaco, monospace, sans-serif;background-color:transparent;font-style:normal;"><br><span></span></div><div style="color:rgb(0, 0, 0);font-size:13.3333px;font-family:Courier New, courier, monaco, monospace,
 sans-serif;background-color:transparent;font-style:normal;"><span>&gt; san1:~ # netstat -tan | grep 77<br></span><span><span>&gt; </span>tcp&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0 192.168.1.1:7789&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 0.0.0.0:*&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; LISTEN<br></span></div><div style="color:rgb(0, 0, 0);font-size:13.3333px;font-family:Courier New, courier, monaco, monospace, sans-serif;background-color:transparent;font-style:normal;"><br><span></span></div><div style="color:rgb(0, 0, 0);font-size:13.3333px;font-family:Courier New, courier, monaco, monospace, sans-serif;background-color:transparent;font-style:normal;"><span>Thoughts? FWIW: There is no data on the resources/volumes so I'm not concerned about preserving the resource/volumes *but* I would like to treat this situation as if there were data so that I can resolve these kinds
 of errors in the
 future.<br></span></div><div style="color:rgb(0, 0, 0);font-size:13.3333px;font-family:Courier New, courier, monaco, monospace, sans-serif;background-color:transparent;font-style:normal;"><br><span></span></div><div style="color:rgb(0, 0, 0);font-size:13.3333px;font-family:Courier New, courier, monaco, monospace, sans-serif;background-color:transparent;font-style:normal;"><span>Eric Pretorious</span></div><div style="color:rgb(0, 0, 0);font-size:13.3333px;font-family:Courier New, courier, monaco, monospace, sans-serif;background-color:transparent;font-style:normal;"><span>Truckee, cA<br></span></div><div><br><blockquote style="border-left:2px solid rgb(16, 16, 255);margin-left:5px;margin-top:5px;padding-left:5px;">  <div style="font-family:Courier New, courier, monaco, monospace, sans-serif;font-size:10pt;"> <div style="font-family:times new roman, new york, times, serif;font-size:12pt;"> <div dir="ltr"> <font face="Arial" size="2"> <hr size="1"> 
 <b><span style="font-weight:bold;">From:</span></b> Dan Barker &lt;dbarker@visioncomm.net&gt;<br> <b><span style="font-weight:bold;">To:</span></b> "drbd-user@lists.linbit.com" &lt;drbd-user@lists.linbit.com&gt; <br> <b><span style="font-weight:bold;">Sent:</span></b> Monday, January 21, 2013 6:40 AM<br> <b><span style="font-weight:bold;">Subject:</span></b> Re: [DRBD-user] Diagnosing a Failed Resource<br> </font> </div> <br>
<div id="yiv951082656">

 
 
<style><!--
#yiv951082656   
 filtered  {font-family:"Cambria Math";panose-1:2 4 5 3 5 4 6 3 2 4;}
#yiv951082656 filtered  {font-family:Calibri;panose-1:2 15 5 2 2 2 4 3 2 4;}
#yiv951082656 filtered  {font-family:Tahoma;panose-1:2 11 6 4 3 5 4 4 2 4;}
#yiv951082656   
 p.yiv951082656MsoNormal, #yiv951082656  li.yiv951082656MsoNormal, #yiv951082656  div.yiv951082656MsoNormal
        {margin:0in;margin-bottom:.0001pt;font-size:12.0pt;font-family:"Times New Roman", "serif";}
#yiv951082656  a:link, #yiv951082656  span.yiv951082656MsoHyperlink
        {color:blue;text-decoration:underline;}
#yiv951082656  a:visited, #yiv951082656  span.yiv951082656MsoHyperlinkFollowed
        {color:purple;text-decoration:underline;}
#yiv951082656  span.yiv951082656EmailStyle17
        {font-family:"Calibri", "sans-serif";color:#1F497D;}
#yiv951082656  .yiv951082656MsoChpDefault
        {font-size:10.0pt;}
#yiv951082656 filtered  {margin:1.0in 1.0in 1.0in 1.0in;}
#yiv951082656  div.yiv951082656WordSection1
        {}
--></style>

<div>
<div class="yiv951082656WordSection1">
<div class="yiv951082656MsoNormal"><span style="font-size:11.0pt;color:#1F497D;">The errors in connecting are logged. If you can’t find them, attempt to connect a resource (drbdadm connect r1, for example) to create the errors again, and
 then look at the logs for the reason the connection was not established. The “status” will continue to show waiting for connection (WFC) but there will be a reason in the log files. If the logs are unclear, post the relevant portions back here and we’ll help.</span></div> 
<div class="yiv951082656MsoNormal"><span style="font-size:11.0pt;color:#1F497D;"> &nbsp;</span></div> 
<div class="yiv951082656MsoNormal"><span style="font-size:11.0pt;color:#1F497D;">Something like ‘dmesg | grep drbd’. You may want to do the logs on both drbd servers. You can do the connect command on either.</span></div> 
<div class="yiv951082656MsoNormal"><span style="font-size:11.0pt;color:#1F497D;"> &nbsp;</span></div> 
<div class="yiv951082656MsoNormal"><span style="font-size:11.0pt;color:#1F497D;">hth</span></div> 
<div class="yiv951082656MsoNormal"><span style="font-size:11.0pt;color:#1F497D;"> &nbsp;</span></div> 
<div class="yiv951082656MsoNormal"><span style="font-size:11.0pt;color:#1F497D;">Dan</span></div> 
<div class="yiv951082656MsoNormal"><span style="font-size:11.0pt;color:#1F497D;"> &nbsp;</span></div> 
<div>
<div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in;">
<div class="yiv951082656MsoNormal" style="margin-left:.5in;"><b><span style="font-size:10.0pt;">From:</span></b><span style="font-size:10.0pt;"> drbd-user-bounces@lists.linbit.com [mailto:drbd-user-bounces@lists.linbit.com]
<b>On Behalf Of </b>Eric<br>
<b>Sent:</b> Monday, January 21, 2013 1:24 AM<br>
<b>To:</b> drbd-user@lists.linbit.com<br>
<b>Subject:</b> [DRBD-user] Diagnosing a Failed Resource</span></div> 
</div>
</div>
<div class="yiv951082656MsoNormal" style="margin-left:.5in;"> &nbsp;</div> 
<div>
<div>
<div class="yiv951082656MsoNormal" style="margin-left:.5in;background:white;"><span style="font-size:10.0pt;color:black;">I've configured corosync+pacemaker to managee a simple two-resource DRBD cluster:</span></div> 
</div>
<div>
<div class="yiv951082656MsoNormal" style="margin-left:.5in;background:white;"><span style="font-size:10.0pt;color:black;"> &nbsp;</span></div> 
</div>
<div>
<div class="yiv951082656MsoNormal" style="margin-left:.5in;"><span style="font-size:10.0pt;color:black;">&gt; san1:~ # crm configure show | cat -<br>
&gt; node san1 \<br>
&gt; &nbsp;&nbsp;&nbsp; attributes standby="off"<br>
&gt; node san2 \<br>
&gt; &nbsp;&nbsp;&nbsp; attributes standby="off"<br>
&gt; primitive p_DRBD-r0 ocf:linbit:drbd \<br>
&gt; &nbsp;&nbsp;&nbsp; params drbd_resource="r0" \<br>
&gt; &nbsp;&nbsp;&nbsp; op monitor interval="60s"<br>
&gt; primitive p_DRBD-r1 ocf:linbit:drbd \<br>
&gt; &nbsp;&nbsp;&nbsp; params drbd_resource="r1" \<br>
&gt; &nbsp;&nbsp;&nbsp; op monitor interval="60s"<br>
&gt; primitive p_IP-1_253 ocf:heartbeat:IPaddr2 \<br>
&gt; &nbsp;&nbsp;&nbsp; params ip="192.168.1.253" cidr_netmask="24" \<br>
&gt; &nbsp;&nbsp;&nbsp; op monitor interval="30s"<br>
&gt; primitive p_IP-1_254 ocf:heartbeat:IPaddr2 \<br>
&gt; &nbsp;&nbsp;&nbsp; params ip="192.168.1.254" cidr_netmask="24" \<br>
&gt; &nbsp;&nbsp;&nbsp; op monitor interval="30s"<br>
&gt; primitive p_iSCSI-san1 ocf:heartbeat:iSCSITarget \<br>
&gt; &nbsp;&nbsp;&nbsp; params iqn="<a rel="nofollow" target="_blank" href="http://iqn.2012-11.com.example.sa/">iqn.2012-11.com</a>.example.san1:sda" \<br>
&gt; &nbsp;&nbsp;&nbsp; op monitor interval="10s"<br>
&gt; primitive p_iSCSI-san1_0 ocf:heartbeat:iSCSILogicalUnit \<br>
&gt; &nbsp;&nbsp;&nbsp; params target_iqn="iqn.2012-11.com.example.san1:sda" lun="0" path="/dev/drbd0" \<br>
&gt; &nbsp;&nbsp;&nbsp; op monitor interval="10s"<br>
&gt; primitive p_iSCSI-san1_1 ocf:heartbeat:iSCSILogicalUnit \<br>
&gt; &nbsp;&nbsp;&nbsp; params target_iqn="iqn.2012-11.com.example.san1:sda" lun="1" path="/dev/drbd1" \<br>
&gt; &nbsp;&nbsp;&nbsp; op monitor interval="10s"<br>
&gt; primitive p_iSCSI-san1_2 ocf:heartbeat:iSCSILogicalUnit \<br>
&gt; &nbsp;&nbsp;&nbsp; params target_iqn="iqn.2012-11.com.example.san1:sda" lun="2" path="/dev/drbd2" \<br>
&gt; &nbsp;&nbsp;&nbsp; op monitor interval="10s"<br>
&gt; primitive p_iSCSI-san1_3 ocf:heartbeat:iSCSILogicalUnit \<br>
&gt; &nbsp;&nbsp;&nbsp; params target_iqn="iqn.2012-11.com.example.san1:sda" lun="3" path="/dev/drbd3" \<br>
&gt; &nbsp;&nbsp;&nbsp; op monitor interval="10s"<br>
&gt; primitive p_iSCSI-san2 ocf:heartbeat:iSCSITarget \<br>
&gt; &nbsp;&nbsp;&nbsp; params iqn="iqn.2012-11.com.example.san2:sda" \<br>
&gt; &nbsp;&nbsp;&nbsp; op monitor interval="10s"<br>
&gt; primitive p_iSCSI-san2_0 ocf:heartbeat:iSCSILogicalUnit \<br>
&gt; &nbsp;&nbsp;&nbsp; params target_iqn="iqn.2012-11.com.example.san2:sda" lun="0" path="/dev/drbd1000" \<br>
&gt; &nbsp;&nbsp;&nbsp; op monitor interval="10s"<br>
&gt; primitive p_iSCSI-san2_1 ocf:heartbeat:iSCSILogicalUnit \<br>
&gt; &nbsp;&nbsp;&nbsp; params target_iqn="iqn.2012-11.com.example.san2:sda" lun="1" path="/dev/drbd1001" \<br>
&gt; &nbsp;&nbsp;&nbsp; op monitor interval="10s"<br>
&gt; primitive p_iSCSI-san2_2 ocf:heartbeat:iSCSILogicalUnit \<br>
&gt; &nbsp;&nbsp;&nbsp; params target_iqn="iqn.2012-11.com.example.san2:sda" lun="2" path="/dev/drbd1002" \<br>
&gt; &nbsp;&nbsp;&nbsp; op monitor interval="10s"<br>
&gt; primitive p_iSCSI-san2_3 ocf:heartbeat:iSCSILogicalUnit \<br>
&gt; &nbsp;&nbsp;&nbsp; params target_iqn="iqn.2012-11.com.example.san2:sda" lun="3" path="/dev/drbd1003" \<br>
&gt; &nbsp;&nbsp;&nbsp; op monitor interval="10s"<br>
&gt; group g_iSCSI-san1 p_iSCSI-san1 p_iSCSI-san1_0 p_iSCSI-san1_1 p_iSCSI-san1_2 p_iSCSI-san1_3 p_IP-1_254<br>
&gt; group g_iSCSI-san2 p_iSCSI-san2 p_iSCSI-san2_0 p_iSCSI-san2_1 p_iSCSI-san2_2 p_iSCSI-san2_3 p_IP-1_253<br>
&gt; ms ms_DRBD-r0 p_DRBD-r0 \<br>
&gt; &nbsp;&nbsp;&nbsp; meta master-max="1" master-node-max="1" clone-max="2" clone-node-max="1" notify="true"<br>
&gt; ms ms_DRBD-r1 p_DRBD-r1 \<br>
&gt; &nbsp;&nbsp;&nbsp; meta master-max="1" master-node-max="1" clone-max="2" clone-node-max="1" notify="true"<br>
&gt; location l_iSCSI-san1_and_DRBD-r0 p_IP-1_254 10240: san1<br>
&gt; location l_iSCSI-san2_and_DRBD-r1 p_IP-1_253 10240: san2<br>
&gt; colocation c_iSCSI_with_DRBD-r0 inf: g_iSCSI-san1 ms_DRBD-r0:Master<br>
&gt; colocation c_iSCSI_with_DRBD-r1 inf: g_iSCSI-san2 ms_DRBD-r1:Master<br>
&gt; order o_DRBD-r0_before_iSCSI-san1 inf: ms_DRBD-r0:promote g_iSCSI-san1:start<br>
&gt; order o_DRBD-r1_before_iSCSI-san2 inf: ms_DRBD-r1:promote g_iSCSI-san2:start<br>
&gt; property $id="cib-bootstrap-options" \<br>
&gt; &nbsp;&nbsp;&nbsp; dc-version="1.1.7-77eeb099a504ceda05d648ed161ef8b1582c7daf" \<br>
&gt; &nbsp;&nbsp;&nbsp; cluster-infrastructure="openais" \<br>
&gt; &nbsp;&nbsp;&nbsp; expected-quorum-votes="2" \<br>
&gt; &nbsp;&nbsp;&nbsp; stonith-enabled="false" \<br>
&gt; &nbsp;&nbsp;&nbsp; no-quorum-policy="ignore"</span></div> 
</div>
<div>
<div class="yiv951082656MsoNormal" style="margin-left:.5in;"><span style="font-size:10.0pt;color:black;"> &nbsp;</span></div> 
</div>
<div>
<div class="yiv951082656MsoNormal" style="margin-left:.5in;"><span style="font-size:10.0pt;color:black;">The cluster appears to be functioning correctly:</span></div> 
</div>
<div>
<div class="yiv951082656MsoNormal" style="margin-left:.5in;background:white;"><span style="font-size:10.0pt;color:black;"> &nbsp;</span></div> 
</div>
<div>
<div class="yiv951082656MsoNormal" style="margin-right:0in;margin-bottom:12.0pt;margin-left:.5in;">
<span style="font-size:10.0pt;color:black;">&gt; san1:~ # crm_mon -1<br>
&gt; ============<br>
&gt; Last updated: Sun Jan 20 22:20:17 2013<br>
&gt; Last change: Sun Jan 20 21:59:15 2013 by root via crm_attribute on san1<br>
&gt; Stack: openais<br>
&gt; Current DC: san1 - partition with quorum<br>
&gt; Version: 1.1.7-77eeb099a504ceda05d648ed161ef8b1582c7daf<br>
&gt; 2 Nodes configured, 2 expected votes<br>
&gt; 16 Resources configured.<br>
&gt; ============<br>
&gt; <br>
&gt; Online: [ san1 san2 ]<br>
&gt; <br>
&gt;&nbsp; Master/Slave Set: ms_DRBD-r0 [p_DRBD-r0]<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Masters: [ san1 ]<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Slaves: [ san2 ]<br>
&gt;&nbsp; Resource Group: g_iSCSI-san1<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san1&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSITarget):&nbsp;&nbsp;&nbsp; Started san1<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san1_0&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSILogicalUnit):&nbsp;&nbsp;&nbsp; Started san1<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san1_1&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSILogicalUnit):&nbsp;&nbsp;&nbsp; Started san1<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san1_2&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSILogicalUnit):&nbsp;&nbsp;&nbsp; Started san1<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san1_3&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSILogicalUnit):&nbsp;&nbsp;&nbsp; Started san1<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_IP-1_254&nbsp;&nbsp;&nbsp; (ocf::heartbeat:IPaddr2):&nbsp;&nbsp;&nbsp; Started san1<br>
&gt;&nbsp; Master/Slave Set: ms_DRBD-r1 [p_DRBD-r1]<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Masters: [ san2 ]<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Slaves: [ san1 ]<br>
&gt;&nbsp; Resource Group: g_iSCSI-san2<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san2&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSITarget):&nbsp;&nbsp;&nbsp; Started san2<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san2_0&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSILogicalUnit):&nbsp;&nbsp;&nbsp; Started san2<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san2_1&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSILogicalUnit):&nbsp;&nbsp;&nbsp; Started san2<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san2_2&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSILogicalUnit):&nbsp;&nbsp;&nbsp; Started san2<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san2_3&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSILogicalUnit):&nbsp;&nbsp;&nbsp; Started san2<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_IP-1_253&nbsp;&nbsp;&nbsp; (ocf::heartbeat:IPaddr2):&nbsp;&nbsp;&nbsp; Started san2<br>
<br>
&gt; san2:~ # crm_mon -1<br>
&gt; ============<br>
&gt; Last updated: Sun Jan 20 22:20:17 2013<br>
&gt; Last change: Sun Jan 20 21:59:15 2013 by root via crm_attribute on san1<br>
&gt; Stack: openais<br>
&gt; Current DC: san1 - partition with quorum<br>
&gt; Version: 1.1.7-77eeb099a504ceda05d648ed161ef8b1582c7daf<br>
&gt; 2 Nodes configured, 2 expected votes<br>
&gt; 16 Resources configured.<br>
&gt; ============<br>
&gt; <br>
&gt; Online: [ san1 san2 ]<br>
&gt; <br>
&gt;&nbsp; Master/Slave Set: ms_DRBD-r0 [p_DRBD-r0]<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Masters: [ san1 ]<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Slaves: [ san2 ]<br>
&gt;&nbsp; Resource Group: g_iSCSI-san1<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san1&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSITarget):&nbsp;&nbsp;&nbsp; Started san1<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san1_0&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSILogicalUnit):&nbsp;&nbsp;&nbsp; Started san1<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san1_1&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSILogicalUnit):&nbsp;&nbsp;&nbsp; Started san1<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san1_2&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSILogicalUnit):&nbsp;&nbsp;&nbsp; Started san1<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san1_3&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSILogicalUnit):&nbsp;&nbsp;&nbsp; Started san1<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_IP-1_254&nbsp;&nbsp;&nbsp; (ocf::heartbeat:IPaddr2):&nbsp;&nbsp;&nbsp; Started san1<br>
&gt;&nbsp; Master/Slave Set: ms_DRBD-r1 [p_DRBD-r1]<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Masters: [ san2 ]<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Slaves: [ san1 ]<br>
&gt;&nbsp; Resource Group: g_iSCSI-san2<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san2&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSITarget):&nbsp;&nbsp;&nbsp; Started san2<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san2_0&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSILogicalUnit):&nbsp;&nbsp;&nbsp; Started san2<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san2_1&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSILogicalUnit):&nbsp;&nbsp;&nbsp; Started san2<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san2_2&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSILogicalUnit):&nbsp;&nbsp;&nbsp; Started san2<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_iSCSI-san2_3&nbsp;&nbsp;&nbsp; (ocf::heartbeat:iSCSILogicalUnit):&nbsp;&nbsp;&nbsp; Started san2<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; p_IP-1_253&nbsp;&nbsp;&nbsp; (ocf::heartbeat:IPaddr2):&nbsp;&nbsp;&nbsp; Started san2</span></div> 
</div>
<div>
<div class="yiv951082656MsoNormal" style="margin-left:.5in;"><span style="font-size:10.0pt;color:black;">However, the two DRBD resources do not appear to be communicating:</span></div> 
</div>
<div>
<div class="yiv951082656MsoNormal" style="margin-left:.5in;"><span style="font-size:10.0pt;color:black;"> &nbsp;</span></div> 
</div>
<div>
<div class="yiv951082656MsoNormal" style="margin-left:.5in;"><span style="font-size:10.0pt;color:black;">&gt; san1:~ # cat /proc/drbd
<br>
&gt; version: 8.4.1 (api:1/proto:86-100)<br>
&gt; GIT-hash: 91b4c048c1a0e06777b5f65d312b38d47abaea80 build by phil@fat-tyre, 2011-12-20 12:43:15<br>
&gt;&nbsp; 0: cs:StandAlone ro:Primary/Unknown ds:UpToDate/DUnknown&nbsp;&nbsp; r-----<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp; ns:0 nr:0 dw:0 dr:664 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:3259080<br>
&gt;&nbsp; 1: cs:StandAlone ro:Primary/Unknown ds:UpToDate/DUnknown&nbsp;&nbsp; r-----<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp; ns:0 nr:0 dw:0 dr:664 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0<br>
&gt;&nbsp; 2: cs:StandAlone ro:Primary/Unknown ds:UpToDate/DUnknown&nbsp;&nbsp; r-----<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp; ns:0 nr:0 dw:0 dr:664 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0<br>
&gt;&nbsp; 3: cs:StandAlone ro:Primary/Unknown ds:UpToDate/DUnknown&nbsp;&nbsp; r-----<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp; ns:0 nr:0 dw:0 dr:664 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0<br>
&gt; <br>
&gt; 1000: cs:StandAlone ro:Secondary/Unknown ds:UpToDate/DUnknown&nbsp;&nbsp; r-----<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp; ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0<br>
&gt; 1001: cs:StandAlone ro:Secondary/Unknown ds:UpToDate/DUnknown&nbsp;&nbsp; r-----<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp; ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0<br>
&gt; 1002: cs:StandAlone ro:Secondary/Unknown ds:UpToDate/DUnknown&nbsp;&nbsp; r-----<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp; ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0<br>
&gt; 1003: cs:StandAlone ro:Secondary/Unknown ds:UpToDate/DUnknown&nbsp;&nbsp; r-----<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp; ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0</span></div> 
</div>
<div>
<div class="yiv951082656MsoNormal" style="margin-left:.5in;"><span style="font-size:10.0pt;color:black;"> &nbsp;</span></div> 
</div>
<div>
<div class="yiv951082656MsoNormal" style="margin-right:0in;margin-bottom:12.0pt;margin-left:.5in;">
<span style="font-size:10.0pt;color:black;">&gt; san2:~ # cat /proc/drbd
<br>
&gt; version: 8.4.1 (api:1/proto:86-100)<br>
&gt; GIT-hash: 91b4c048c1a0e06777b5f65d312b38d47abaea80 build by phil@fat-tyre, 2011-12-20 12:43:15<br>
&gt;&nbsp; 0: cs:WFConnection ro:Secondary/Unknown ds:UpToDate/DUnknown C r-----<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp; ns:0 nr:0 dw:0 dr:664 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:140<br>
&gt;&nbsp; 1: cs:WFConnection ro:Secondary/Unknown ds:UpToDate/DUnknown C r-----<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp; ns:0 nr:0 dw:0 dr:664 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0<br>
&gt;&nbsp; 2: cs:WFConnection ro:Secondary/Unknown ds:UpToDate/DUnknown C r-----<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp; ns:0 nr:0 dw:0 dr:664 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0<br>
&gt;&nbsp; 3: cs:WFConnection ro:Secondary/Unknown ds:UpToDate/DUnknown C r-----<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp; ns:0 nr:0 dw:0 dr:664 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0<br>
&gt; <br>
&gt; 1000: cs:WFConnection ro:Primary/Unknown ds:UpToDate/DUnknown C r-----<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp; ns:0 nr:0 dw:0 dr:664 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0<br>
&gt; 1001: cs:WFConnection ro:Primary/Unknown ds:UpToDate/DUnknown C r-----<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp; ns:0 nr:0 dw:0 dr:664 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0<br>
&gt; 1002: cs:WFConnection ro:Primary/Unknown ds:UpToDate/DUnknown C r-----<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp; ns:0 nr:0 dw:0 dr:664 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0<br>
&gt; 1003: cs:WFConnection ro:Primary/Unknown ds:UpToDate/DUnknown C r-----<br>
&gt;&nbsp;&nbsp;&nbsp;&nbsp; ns:0 nr:0 dw:0 dr:664 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0</span></div> 
</div>
<div>
<div class="yiv951082656MsoNormal" style="margin-left:.5in;"><span style="font-size:10.0pt;color:black;">How can I begin to troubleshoot this error?</span></div> 
</div>
<div>
<div class="yiv951082656MsoNormal" style="margin-left:.5in;"><span style="font-size:10.0pt;color:black;"> &nbsp;</span></div> 
</div>
<div>
<div class="yiv951082656MsoNormal" style="margin-left:.5in;"><span style="font-size:10.0pt;color:black;">Eric Pretorious</span></div> 
</div>
<div>
<div class="yiv951082656MsoNormal" style="margin-left:.5in;"><span style="font-size:10.0pt;color:black;">Truckee, cA</span></div> 
</div>
</div>
</div>
</div>

</div><br>_______________________________________________<br>drbd-user mailing list<br><a rel="nofollow" ymailto="mailto:drbd-user@lists.linbit.com" target="_blank" href="mailto:drbd-user@lists.linbit.com">drbd-user@lists.linbit.com</a><br><a rel="nofollow" target="_blank" href="http://lists.linbit.com/mailman/listinfo/drbd-user">http://lists.linbit.com/mailman/listinfo/drbd-user</a><br><br><br> </div> </div> </blockquote></div>   </div></div></div><br><br> </div> </div> </blockquote></div>   </div></body></html>