Dear All<br><br>I am running 2 DRBD servers 1 primary and another secondary .. some how a heavy load is generating for some time and alsoon machine that mount drbd volumes.<br><br>plz check lgs and suggest<br><br>Primary DRBD server<br>
<br>version: 0.7.23 (api:79/proto:74)<br>SVN Revision: 2686 build by root@typhoon, 2007-04-24 12:59:48<br> 0: cs:Connected st:Primary/Secondary ld:Consistent<br>    ns:557977692 nr:0 dw:557977692 dr:958716685 al:3234676 bm:0 lo:0 pe:0 ua:0 ap:0<br>
 1: cs:Connected st:Secondary/Primary ld:Consistent<br>    ns:0 nr:803962632 dw:803962632 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0<br><br><br>This dr:958716685 is continously increasing<br><br>drbd: initialised. Version: 0.7.23 (api:79/proto:74)<br>
drbd: SVN Revision: 2686 build by root@typhoon, 2007-04-24 12:59:48<br>drbd: registered as block device major 147<br>drbd0: Adjusting my ra_pages to backing device&#39;s (32 -&gt; 1024)<br>drbd0: resync bitmap: bits=48827552 words=1525862<br>
drbd0: size = 186 GB (195310206 KB)<br>drbd0: 0 KB marked out-of-sync by on disk bit-map.<br>drbd0: Found 6 transactions (324 active extents) in activity log.<br>drbd0: drbdsetup [1232]: cstate Unconfigured --&gt; StandAlone<br>
drbd1: Adjusting my ra_pages to backing device&#39;s (32 -&gt; 1024)<br>drbd1: resync bitmap: bits=48827552 words=1525862<br>drbd1: size = 186 GB (195310206 KB)<br>drbd1: 0 KB marked out-of-sync by on disk bit-map.<br>drbd1: No usable activity log found.<br>
drbd1: drbdsetup [1236]: cstate Unconfigured --&gt; StandAlone<br>drbd0: drbdsetup [1254]: cstate StandAlone --&gt; Unconnected<br>drbd0: drbd0_receiver [1255]: cstate Unconnected --&gt; WFConnection<br>drbd1: drbdsetup [1262]: cstate StandAlone --&gt; Unconnected<br>
drbd1: drbd1_receiver [1263]: cstate Unconnected --&gt; WFConnection<br>drbd1: drbd1_receiver [1263]: cstate WFConnection --&gt; WFReportParams<br>drbd1: Handshake successful: DRBD Network Protocol version 74<br>drbd1: Connection established.<br>
drbd1: I am(S): 1:00000002:00000001:00000038:00000001:00<br>drbd1: Peer(S): 1:00000002:00000001:00000039:00000001:00<br>drbd1: drbd1_receiver [1263]: cstate WFReportParams --&gt; WFBitMapT<br>drbd1: Secondary/Unknown --&gt; Secondary/Secondary<br>
drbd1: drbd1_receiver [1263]: cstate WFBitMapT --&gt; SyncTarget<br>drbd1: Resync started as SyncTarget (need to sync 0 KB [0 bits set]).<br>drbd1: Resync done (total 1 sec; paused 0 sec; 0 K/sec)<br>drbd1: drbd1_receiver [1263]: cstate SyncTarget --&gt; Connected<br>
drbd0: drbd0_receiver [1255]: cstate WFConnection --&gt; WFReportParams<br>drbd0: Handshake successful: DRBD Network Protocol version 74<br>drbd0: Connection established.<br>drbd0: I am(S): 1:00000003:00000001:0000003a:00000001:00<br>
drbd0: Peer(S): 1:00000003:00000001:0000003a:00000001:00<br>drbd0: drbd0_receiver [1255]: cstate WFReportParams --&gt; Connected<br>drbd0: Secondary/Unknown --&gt; Secondary/Secondary<br>drbd0: Secondary/Secondary --&gt; Primary/Secondary<br>
drbd1: Secondary/Secondary --&gt; Secondary/Primary<br>LDISKFS FS on drbd0, internal journal<br>Lustre: OST ost1 now serving /dev/drbd0 (fc85bbea-e745-4101-b3b7-ca5308aea38b) with recovery enabled<br>drbd0: [ll_ost_io_56/1728] sock_sendmsg time expired, ko = 4294967295<br>
drbd1: PingAck did not arrive in time.<br>drbd1: drbd1_asender [1275]: cstate Connected --&gt; NetworkFailure<br>drbd1: asender terminated<br>drbd1: drbd1_receiver [1263]: cstate NetworkFailure --&gt; BrokenPipe<br>drbd1: short read expecting header on sock: r=-512<br>
drbd1: worker terminated<br>drbd1: drbd1_receiver [1263]: cstate BrokenPipe --&gt; Unconnected<br>drbd1: Connection lost.<br>drbd1: drbd1_receiver [1263]: cstate Unconnected --&gt; WFConnection<br>drbd0: PingAck did not arrive in time.<br>
drbd0: drbd0_asender [1276]: cstate Connected --&gt; NetworkFailure<br>drbd0: asender terminated<br>drbd0: drbd0_receiver [1255]: cstate NetworkFailure --&gt; BrokenPipe<br>drbd0: short read expecting header on sock: r=-512<br>
drbd0: worker terminated<br>drbd0: drbd0_receiver [1255]: cstate BrokenPipe --&gt; Unconnected<br>drbd0: Connection lost.<br>drbd0: drbd0_receiver [1255]: cstate Unconnected --&gt; WFConnection<br>drbd0: drbd0_receiver [1255]: cstate WFConnection --&gt; WFReportParams<br>
drbd0: Handshake successful: DRBD Network Protocol version 74<br>drbd0: Connection established.<br>drbd0: I am(P): 1:00000003:00000001:0000003c:00000001:10<br>drbd0: Peer(S): 1:00000003:00000001:0000003b:00000001:01<br>drbd0: drbd0_receiver [1255]: cstate WFReportParams --&gt; WFBitMapS<br>
drbd0: Primary/Unknown --&gt; Primary/Secondary<br>drbd0: drbd0_receiver [1255]: cstate WFBitMapS --&gt; SyncSource<br>drbd0: Resync started as SyncSource (need to sync 0 KB [0 bits set]).<br>drbd0: Resync done (total 1 sec; paused 0 sec; 0 K/sec)<br>
drbd0: drbd0_receiver [1255]: cstate SyncSource --&gt; Connected<br>drbd1: drbd1_receiver [1263]: cstate WFConnection --&gt; WFReportParams<br>drbd1: Handshake successful: DRBD Network Protocol version 74<br>drbd1: Connection established.<br>
drbd1: I am(S): 1:00000002:00000001:0000003a:00000001:01<br>drbd1: Peer(P): 1:00000002:00000001:0000003b:00000001:10<br>drbd1: drbd1_receiver [1263]: cstate WFReportParams --&gt; WFBitMapT<br>drbd1: Secondary/Unknown --&gt; Secondary/Primary<br>
drbd1: drbd1_receiver [1263]: cstate WFBitMapT --&gt; SyncTarget<br>drbd1: Resync started as SyncTarget (need to sync 0 KB [0 bits set]).<br>drbd1: Resync done (total 1 sec; paused 0 sec; 0 K/sec)<br>drbd1: drbd1_receiver [1263]: cstate SyncTarget --&gt; Connected<br>
drbd0: [ll_ost_io_33/1705] sock_sendmsg time expired, ko = 4294967295<br>drbd0: [ll_ost_io_35/1707] sock_sendmsg time expired, ko = 4294967295<br>drbd0: [pdflush/25426] sock_sendmsg time expired, ko = 4294967295<br><br><br>
<br>Secodary DRBD server<br>version: 0.7.23 (api:79/proto:74)<br>SVN Revision: 2686 build by root@cyclops, 2007-04-24 14:09:56<br> 0: cs:Connected st:Secondary/Primary ld:Consistent<br>    ns:0 nr:558038644 dw:558038644 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0<br>
 1: cs:Connected st:Primary/Secondary ld:Consistent<br>    ns:804035788 nr:0 dw:804035780 dr:1236043325 al:7327297 bm:0 lo:3 pe:235 ua:0 ap:234<br><br><br>drbd1: [ll_ost_io_34/1701] sock_sendmsg time expired, ko = 4294967295<br>
drbd1: [ll_ost_io_22/1689] sock_sendmsg time expired, ko = 4294967295<br>drbd1: [pdflush/6996] sock_sendmsg time expired, ko = 4294967295<br>drbd1: [ll_ost_io_00/1667] sock_sendmsg time expired, ko = 4294967295<br>drbd1: [ll_ost_io_37/1704] sock_sendmsg time expired, ko = 4294967295<br>
drbd1: [ll_ost_io_53/1720] sock_sendmsg time expired, ko = 4294967295<br>drbd1: [ll_ost_io_60/1727] sock_sendmsg time expired, ko = 4294967295<br>drbd1: [ll_ost_io_23/1690] sock_sendmsg time expired, ko = 4294967295<br><br>
<br clear="all"><br>-- <br>Regards<br><br>Nauman Yousuf<br>0321-2549206<br>E-Eager, N-Noble, G-Genuine, I-Intelligent, N-Natural, E-Enthusiastic, E-Energetic, R-Resourcefull --- ENGINEER<br>