<html>
<head>
<style><!--
.hmmessage P
{
margin:0px;
padding:0px
}
body.hmmessage
{
font-size: 10pt;
font-family:Tahoma
}
--></style>
</head>
<body class='hmmessage'>
Thanks for responding,<BR>
&nbsp;<BR>
FYI: I have ran stat command to get details of the files whose data is seen criss-crossing.&nbsp;I mean content of one file is seen in another.&nbsp;Snapshot enclosed at the end, when corruption occured.<BR>
Files which have an issue belong to same block,&nbsp;<STRONG> IO Block: 4096&nbsp;&nbsp; </STRONG><BR>
<STRONG>Every&nbsp;corruption&nbsp;seen, content of /repl/firewall/sysconfig/iptables content is seen in /repl/snmpagent/data/snmpd.conf</STRONG><BR>
&nbsp;<BR>
&nbsp;How much is "few"?<BR>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Today After 12 failovers. Last run after 80 failovers similar corruption is seen.<BR>
<BR>&nbsp;What is the IO load?<BR>
&nbsp;&nbsp;&nbsp; Note exactly sure, When sigterm is received there are 2 processes which write config data to DRBD partition.<BR>
<BR>&nbsp;How do you trigger the failover?<BR>
&nbsp;&nbsp; using reboot command<BR>
<BR>DRBD version, kernel version, file system type?<BR>
&nbsp;&nbsp; DRBD-8.0.16, 2.6.14.7, EXT3-FS<BR>
<BR>&nbsp;Volatile caches involved?<BR>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; NO<BR>How often/when do you fsck?<BR>
&nbsp; Every time&nbsp;DRBD-GO-Primary script is called. Before mounting DRBD partition we&nbsp;invoke&nbsp;fsck -fy<BR><BR>
&nbsp; File: `/repl/ipsec/ipsec_xml'<BR>&nbsp; Size: 0&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp;Blocks: 2&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <STRONG>IO Block: 4096&nbsp;&nbsp; </STRONG>regular empty file<BR>Device: fe03h/65027d&nbsp;Inode: 6404&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Links: 1<BR>Access: (0640/-rw-r-----)&nbsp; Uid: (&nbsp;&nbsp;&nbsp; 0/&nbsp;&nbsp;&nbsp; root)&nbsp;&nbsp; Gid: (&nbsp; 201/&nbsp;&nbsp;&nbsp; admin)<BR>Access: 2010-09-07 10:06:55.000000000 +0000<BR>Modify: 2010-09-07 10:07:12.000000000 +0000<BR>Change: 2010-09-07 10:07:12.000000000 +0000<BR>&nbsp; File: `/repl/ipsec/psk.txt'<BR>&nbsp; Size: 242&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp;Blocks: 4&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <STRONG>IO Block: 4096&nbsp;&nbsp; </STRONG>regular file<BR>Device: fe03h/65027d&nbsp;Inode: 6397&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Links: 1<BR>Access: (0600/-rw-------)&nbsp; Uid: (&nbsp;&nbsp;&nbsp; 0/&nbsp;&nbsp;&nbsp; root)&nbsp;&nbsp; Gid: (&nbsp;&nbsp;&nbsp; 0/&nbsp;&nbsp;&nbsp; root)<BR>Access: 2006-08-03 17:03:19.000000000 +0000<BR>Modify: 2010-09-07 10:07:12.000000000 +0000<BR>Change: 2010-09-07 10:07:12.000000000 +0000<BR>&nbsp; File: `/repl/ipsec/racoon.conf'<BR>&nbsp; Size: 1793&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp;Blocks: 6&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <STRONG>IO Block: 4096&nbsp;&nbsp; </STRONG>regular file<BR>Device: fe03h/65027d&nbsp;Inode: 6391&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Links: 1<BR>Access: (0755/-rwxr-xr-x)&nbsp; Uid: (&nbsp;&nbsp;&nbsp; 0/&nbsp;&nbsp;&nbsp; root)&nbsp;&nbsp; Gid: (&nbsp;&nbsp;&nbsp; 0/&nbsp;&nbsp;&nbsp; root)<BR>Access: 2010-09-07 10:02:49.000000000 +0000<BR>Modify: 2010-09-07 10:07:12.000000000 +0000<BR>Change: 2010-09-07 10:07:12.000000000 +0000<BR>&nbsp; File: `/repl/ipsec/setkey.conf'<BR>&nbsp; Size: 121&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp;Blocks: 4&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <STRONG>IO Block: 4096&nbsp;&nbsp; </STRONG>regular file<BR>Device: fe03h/65027d&nbsp;Inode: 6398&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Links: 1<BR>Access: (0755/-rwxr-xr-x)&nbsp; Uid: (&nbsp;&nbsp;&nbsp; 0/&nbsp;&nbsp;&nbsp; root)&nbsp;&nbsp; Gid: (&nbsp;&nbsp;&nbsp; 0/&nbsp;&nbsp;&nbsp; root)<BR>Access: 2006-08-03 17:03:16.000000000 +0000<BR>Modify: 2010-09-07 10:07:12.000000000 +0000<BR>Change: 2010-09-07 10:07:12.000000000 +0000<BR>&nbsp; File: `/repl/firewall/sysconfig/iptables'<BR>&nbsp; Size: 1797&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp;Blocks: 6&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<STRONG> IO Block: 4096&nbsp;&nbsp; </STRONG>regular file<BR>Device: fe03h/65027d&nbsp;Inode: 14461&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Links: 1<BR>Access: (0600/-rw-------)&nbsp; Uid: (&nbsp;&nbsp;&nbsp; 0/&nbsp;&nbsp;&nbsp; root)&nbsp;&nbsp; Gid: (&nbsp;&nbsp;&nbsp; 0/&nbsp;&nbsp;&nbsp; root)<BR>Access: 2010-09-07 10:02:51.000000000 +0000<BR>Modify: 2010-09-07 10:07:13.000000000 +0000<BR>Change: 2010-09-07 10:07:13.000000000 +0000<BR>&nbsp; File: `/repl/snmpdagent/data/snmpd.conf'<BR>&nbsp; Size: 683&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp;Blocks: 4&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;<STRONG> IO Block: 4096&nbsp;&nbsp; </STRONG>regular file<BR>Device: fe03h/65027d&nbsp;Inode: 20744&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Links: 1<BR>Access: (0600/-rw-------)&nbsp; Uid: (&nbsp;&nbsp;&nbsp; 0/&nbsp;&nbsp;&nbsp; root)&nbsp;&nbsp; Gid: (&nbsp; 601/usergroup)<BR>Access: 2010-09-07 10:07:14.000000000 +0000<BR>Modify: 2010-09-07 10:07:14.000000000 +0000<BR>Change: 2010-09-07 10:07:14.000000000 +0000<BR>
&nbsp;<BR>
Appreciate your help,<BR>
Lak.<BR><BR>&nbsp;<BR>&gt; Date: Tue, 7 Sep 2010 12:16:59 +0200<BR>&gt; From: lars.ellenberg@linbit.com<BR>&gt; To: drbd-user@lists.linbit.com<BR>&gt; Subject: Re: [DRBD-user] File corruption in drbd partition<BR>&gt; <BR>&gt; On Tue, Sep 07, 2010 at 09:35:48AM +0000, putcha narayana wrote:<BR>&gt; &gt; <BR>&gt; &gt; Hi,<BR>&gt; &gt; <BR>&gt; &gt; We are running continuous failovers on a redundant setup (Active / Standby).<BR>&gt; &gt; After few failovers we observe content of file x appears inside file y.<BR>&gt; <BR>&gt; How much is "few"?<BR>&gt; What is the IO load?<BR>&gt; How do you trigger the failover?<BR>&gt; DRBD version, kernel version, file system type?<BR>&gt; Volatile caches involved?<BR>&gt; How often/when do you fsck?<BR>&gt; <BR>&gt; &gt; In one particular case we observed inode corruption, when fsck command is run on /repl partition.<BR>&gt; &gt; Multiply-claimed block(s) in inode 28: 1233 1249 1251 1252<BR>&gt; &gt; Multiply-claimed block(s) in inode 1183: 1251 1252<BR>&gt; &gt; Multiply-claimed block(s) in inode 1184: 1233<BR>&gt; &gt; Multiply-claimed block(s) in inode 1185: 1249<BR>&gt; &gt; <BR>&gt; &gt; When fsck -fy is run on /repl partition then the end result is content of file x is seen in file y.<BR>&gt; <BR>&gt; <BR>&gt; <BR>&gt; -- <BR>&gt; : Lars Ellenberg<BR>&gt; : LINBIT | Your Way to High Availability<BR>&gt; : DRBD/HA support and consulting http://www.linbit.com<BR>&gt; <BR>&gt; DRBD® and LINBIT® are registered trademarks of LINBIT, Austria.<BR>&gt; __<BR>&gt; please don't Cc me, but send to list -- I'm subscribed<BR>&gt; _______________________________________________<BR>&gt; drbd-user mailing list<BR>&gt; drbd-user@lists.linbit.com<BR>&gt; http://lists.linbit.com/mailman/listinfo/drbd-user<BR>                                               </body>
</html>