<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">
  <title></title>
</head>
<body bgcolor="#ffffff" text="#000000">
Hello Lars,<br>
<br>
I use Debian Etch Standard Kernel k713 2.6.18-4-amd64 and k641
2.6.18-5-686 <br>
and first i used drbd8 from backports now 8.0.8 from linbit website
compiled as module with the kernel headers<br>
<br>
It is possible to use different kernel architecture so far amd64 and
i386? <br>
If not i have the option to install k641 with an amd64 kernel<br>
<br>
and there you trigger some assertions. "interessting" :)&nbsp; I don&acute;t
understand<br>
<pre wrap="">k713 is the primary one and is in production as nfs server 
on k641 i stopped the drbd /etc/init.d/drbd stop
and restart it with /etc/init.d/drbd start

the resulting syslog follows

k641
Dec 29 10:27:07 k641 kernel: drbd: initialised. Version: 8.0.8 (api:86/proto:86)
Dec 29 10:27:07 k641 kernel: drbd: GIT-hash: bd3e2c922f95c4fa0dca57a4f8c24bf8b249cc02 build by root@k641, 2007-12-28 01:
07:54
Dec 29 10:27:07 k641 kernel: drbd: registered as block device major 147
Dec 29 10:27:07 k641 kernel: drbd: minor_table @ 0xc2363740
Dec 29 10:27:07 k641 kernel: drbd0: disk( Diskless -&gt; Attaching )
Dec 29 10:27:07 k641 kernel: klogd 1.4.1, ---------- state change ----------
Dec 29 10:27:07 k641 kernel: drbd0: No usable activity log found.
Dec 29 10:27:07 k641 kernel: drbd0: max_segment_size ( = BIO size ) = 32768
Dec 29 10:27:07 k641 kernel: drbd0: drbd_bm_resize called with capacity == 3145631928
Dec 29 10:27:07 k641 kernel: drbd0: resync bitmap: bits=393203991 words=12287626
Dec 29 10:27:07 k641 kernel: drbd0: size = 1499 GB (1572815964 KB)
Dec 29 10:27:07 k641 kernel: drbd0: reading of bitmap took 46 jiffies
Dec 29 10:27:07 k641 kernel: drbd0: recounting of set bits took additional 19 jiffies
Dec 29 10:27:07 k641 kernel: drbd0: 735 GB (192889111 bits) marked out-of-sync by on disk bit-map.
Dec 29 10:27:07 k641 kernel: drbd0: disk( Attaching -&gt; Inconsistent )
Dec 29 10:27:07 k641 kernel: drbd0: Writing meta data super block now.
Dec 29 10:27:07 k641 kernel: drbd0: conn( StandAlone -&gt; Unconnected )
Dec 29 10:27:07 k641 kernel: drbd0: receiver (re)started
Dec 29 10:27:07 k641 kernel: drbd0: conn( Unconnected -&gt; WFConnection )
Dec 29 10:27:07 k641 kernel: drbd0: Handshake successful: DRBD Network Protocol version 86
Dec 29 10:27:07 k641 kernel: drbd0: Peer authenticated using 32 bytes of 'sha256' HMAC
Dec 29 10:27:07 k641 kernel: drbd0: conn( WFConnection -&gt; WFReportParams )
Dec 29 10:27:07 k641 kernel: drbd0: Becoming sync target due to disk states.
Dec 29 10:27:07 k641 kernel: drbd0: peer( Unknown -&gt; Primary ) conn( WFReportParams -&gt; WFBitMapT ) pdsk( DUnknown -&gt; UpT
oDate )
Dec 29 10:27:07 k641 kernel: drbd0: Writing meta data super block now.
Dec 29 10:27:08 k641 kernel: drbd0: conn( WFBitMapT -&gt; WFSyncUUID )
Dec 29 10:27:08 k641 kernel: drbd0: conn( WFSyncUUID -&gt; SyncTarget )
Dec 29 10:27:08 k641 kernel: drbd0: Began resync as SyncTarget (will sync 812948580 KB [203237145 bits set]).
Dec 29 10:27:08 k641 kernel: drbd0: Writing meta data super block now.
Dec 29 10:27:09 k641 kernel: drbd0: magic?? on data m: 0x0 c: 0 l: 0
Dec 29 10:27:09 k641 kernel: drbd0: ASSERT( mdev-&gt;state.conn &lt; Connected ) in /usr/src/drbd-8.0.8/drbd/drbd_receiver.c:2
703
Dec 29 10:27:09 k641 kernel: drbd0: ASSERT( mdev-&gt;state.conn &lt; Connected ) in /usr/src/drbd-8.0.8/drbd/drbd_receiver.c:3
436
Dec 29 10:27:09 k641 kernel: drbd0: asender terminated
Dec 29 10:27:10 k641 kernel: drbd0: logic bug? rs_left=203236788 &gt; rs_total=0 (rs_failed 0)
Dec 29 10:27:10 k641 last message repeated 7 times
Dec 29 10:27:10 k641 kernel: drbd0: resync inactive, but callback triggered??
Dec 29 10:27:10 k641 kernel: drbd0: tl_clear()
Dec 29 10:27:10 k641 kernel: drbd0: Connection closed
Dec 29 10:27:10 k641 kernel: drbd0: peer( Primary -&gt; Unknown ) conn( SyncTarget -&gt; Unconnected ) pdsk( UpToDate -&gt; DUnkn
own )
Dec 29 10:27:10 k641 kernel: drbd0: drbdd_init: (mdev-&gt;receiver.t_state != Restarting) in /usr/src/drbd-8.0.8/drbd/drbd_
receiver.c:3117
Dec 29 10:27:10 k641 kernel: drbd0: receiver terminated
Dec 29 10:27:10 k641 kernel: drbd0: receiver (re)started
Dec 29 10:27:10 k641 kernel: drbd0: conn( Unconnected -&gt; WFConnection )
Dec 29 10:27:10 k641 kernel: drbd0: Handshake successful: DRBD Network Protocol version 86
Dec 29 10:27:10 k641 kernel: drbd0: Peer authenticated using 32 bytes of 'sha256' HMAC
Dec 29 10:27:10 k641 kernel: drbd0: conn( WFConnection -&gt; WFReportParams )
Dec 29 10:27:10 k641 kernel: drbd0: Writing meta data super block now.
Dec 29 10:27:10 k641 kernel: drbd0: Becoming sync target due to disk states.
Dec 29 10:27:10 k641 kernel: drbd0: peer( Unknown -&gt; Primary ) conn( WFReportParams -&gt; WFBitMapT ) pdsk( DUnknown -&gt; UpT
oDate )
Dec 29 10:27:10 k641 kernel: drbd0: Writing meta data super block now.
Dec 29 10:27:11 k641 kernel: drbd0: conn( WFBitMapT -&gt; WFSyncUUID )
Dec 29 10:27:11 k641 kernel: drbd0: conn( WFSyncUUID -&gt; SyncTarget )
Dec 29 10:27:11 k641 kernel: drbd0: Began resync as SyncTarget (will sync 812947488 KB [203236872 bits set]).
Dec 29 10:27:11 k641 kernel: drbd0: Writing meta data super block now.
Dec 29 10:27:14 k641 kernel: drbd0: magic?? on data m: 0x0 c: 0 l: 0
Dec 29 10:27:14 k641 kernel: drbd0: ASSERT( mdev-&gt;state.conn &lt; Connected ) in /usr/src/drbd-8.0.8/drbd/drbd_receiver.c:2
703
Dec 29 10:27:14 k641 kernel: drbd0: ASSERT( mdev-&gt;state.conn &lt; Connected ) in /usr/src/drbd-8.0.8/drbd/drbd_receiver.c:3
436
Dec 29 10:27:14 k641 kernel: drbd0: asender terminated
Dec 29 10:27:14 k641 kernel: drbd0: logic bug? rs_left=203233107 &gt; rs_total=0 (rs_failed 0)
Dec 29 10:27:14 k641 last message repeated 4 times
Dec 29 10:27:14 k641 kernel: drbd0: resync inactive, but callback triggered??
Dec 29 10:27:14 k641 kernel: drbd0: tl_clear()
Dec 29 10:27:14 k641 kernel: drbd0: Connection closed
Dec 29 10:27:14 k641 kernel: drbd0: peer( Primary -&gt; Unknown ) conn( SyncTarget -&gt; Unconnected ) pdsk( UpToDate -&gt; DUnkn
own )
Dec 29 10:27:14 k641 kernel: drbd0: drbdd_init: (mdev-&gt;receiver.t_state != Restarting) in /usr/src/drbd-8.0.8/drbd/drbd_
receiver.c:3117




k713
Dec 29 10:27:06 k713 kernel: drbd0: Handshake successful: DRBD Network Protocol version 86
Dec 29 10:27:06 k713 kernel: drbd0: Peer authenticated using 32 bytes of 'sha256' HMAC
Dec 29 10:27:06 k713 kernel: drbd0: conn( WFConnection -&gt; WFReportParams )
Dec 29 10:27:06 k713 kernel: drbd0: Becoming sync source due to disk states.
Dec 29 10:27:06 k713 kernel: drbd0: peer( Unknown -&gt; Secondary ) conn( WFReportParams -&gt; WFBitMapS )
Dec 29 10:27:06 k713 kernel: drbd0: Writing meta data super block now.
Dec 29 10:27:07 k713 kernel: drbd0: conn( WFBitMapS -&gt; SyncSource )
Dec 29 10:27:07 k713 kernel: drbd0: Began resync as SyncSource (will sync 812948580 KB [203237145 bits set]).
Dec 29 10:27:07 k713 kernel: drbd0: Writing meta data super block now.
Dec 29 10:27:08 k713 kernel: drbd0: meta connection shut down by peer.
Dec 29 10:27:08 k713 kernel: drbd0: peer( Secondary -&gt; Unknown ) conn( SyncSource -&gt; NetworkFailure )
Dec 29 10:27:08 k713 kernel: drbd0: asender terminated
Dec 29 10:27:08 k713 kernel: drbd0: sock was reset by peer
Dec 29 10:27:08 k713 kernel: drbd0: short read expecting header on sock: r=-104
Dec 29 10:27:08 k713 kernel: drbd0: tl_clear()
Dec 29 10:27:08 k713 kernel: drbd0: Connection closed
Dec 29 10:27:08 k713 kernel: drbd0: Writing meta data super block now.
Dec 29 10:27:08 k713 kernel: drbd0: conn( NetworkFailure -&gt; Unconnected )
Dec 29 10:27:08 k713 kernel: drbd0: receiver terminated
Dec 29 10:27:08 k713 kernel: drbd0: receiver (re)started
Dec 29 10:27:08 k713 kernel: drbd0: conn( Unconnected -&gt; WFConnection )
Dec 29 10:27:08 k713 kernel: drbd0: Handshake successful: DRBD Network Protocol version 86
Dec 29 10:27:08 k713 kernel: drbd0: Peer authenticated using 32 bytes of 'sha256' HMAC
Dec 29 10:27:08 k713 kernel: drbd0: conn( WFConnection -&gt; WFReportParams )
Dec 29 10:27:08 k713 kernel: drbd0: Becoming sync source due to disk states.
Dec 29 10:27:08 k713 kernel: drbd0: peer( Unknown -&gt; Secondary ) conn( WFReportParams -&gt; WFBitMapS )
Dec 29 10:27:09 k713 kernel: drbd0: Writing meta data super block now.
Dec 29 10:27:10 k713 kernel: drbd0: conn( WFBitMapS -&gt; SyncSource )
Dec 29 10:27:10 k713 kernel: drbd0: Began resync as SyncSource (will sync 812947488 KB [203236872 bits set]).
Dec 29 10:27:10 k713 kernel: drbd0: Writing meta data super block now.
Dec 29 10:27:12 k713 kernel: drbd0: meta connection shut down by peer.
Dec 29 10:27:12 k713 kernel: drbd0: peer( Secondary -&gt; Unknown ) conn( SyncSource -&gt; NetworkFailure )
Dec 29 10:27:12 k713 kernel: drbd0: asender terminated
Dec 29 10:27:12 k713 kernel: drbd0: sock was reset by peer
Dec 29 10:27:12 k713 kernel: drbd0: short read expecting header on sock: r=-104
Dec 29 10:27:12 k713 kernel: drbd0: tl_clear()
Dec 29 10:27:12 k713 kernel: drbd0: Connection closed
Dec 29 10:27:12 k713 kernel: drbd0: Writing meta data super block now.
Dec 29 10:27:13 k713 kernel: drbd0: conn( NetworkFailure -&gt; Unconnected )
Dec 29 10:27:13 k713 kernel: drbd0: receiver terminated


Lars Ellenberg schrieb:</pre>
<blockquote cite="mid:20071229010045.GA7142@localhost" type="cite">
  <pre wrap="">On Fri, Dec 28, 2007 at 10:56:06PM +0100, Harald Rinker wrote:
  </pre>
  <blockquote type="cite">
    <pre wrap="">Hello Lars,
i use now 8.0.8 on both side&acute;s but it&acute;s anyway the same

my syslog say&acute;s
Dec 28 22:31:50 k641 kernel: drbd0: Writing meta data super block now.
Dec 28 22:31:51 k641 kernel: drbd0: conn( WFBitMapT -&gt; WFSyncUUID )
Dec 28 22:31:51 k641 kernel: drbd0: conn( WFSyncUUID -&gt; SyncTarget )
Dec 28 22:31:51 k641 kernel: drbd0: Began resync as SyncTarget (will sync
814504672 KB [203626168 bits set]).
Dec 28 22:31:51 k641 kernel: drbd0: Writing meta data super block now.
Dec 28 22:31:59 k641 kernel: drbd0: magic?? on data m: 0xffffffff c: 65535 l:
65535
    </pre>
  </blockquote>
  <pre wrap=""><!---->
the packet that drbd received consists of all ones,
where drbd expected it to be the standard header
"drbd magic, command, payload length".
strange.

what exact kernel are you using?
does that happen to have CONFIG_LBD disabled?

if that is the case, sector_t would become
"unsigned long" instead of "u64".

this is just an unverified guess,
but that might cause some of the internal calculations to overflow,
where we mix u64, unsigned long long and sector_t.

  </pre>
  <blockquote type="cite">
    <pre wrap="">Dec 28 22:31:59 k641 kernel: drbd0: ASSERT( mdev-&gt;state.conn &lt; Connected ) in /
usr/src/drbd-8.0.8/drbd/drbd_receiver.c:2703
Dec 28 22:31:59 k641 kernel: drbd0: ASSERT( mdev-&gt;state.conn &lt; Connected ) in /
usr/src/drbd-8.0.8/drbd/drbd_receiver.c:3436
Dec 28 22:31:59 k641 kernel: drbd0: asender terminated
Dec 28 22:31:59 k641 kernel: drbd0: tl_clear()
Dec 28 22:31:59 k641 kernel: drbd0: Connection closed
Dec 28 22:31:59 k641 kernel: drbd0: peer( Primary -&gt; Unknown ) conn( SyncTarget
-&gt; Unconnected ) pdsk( UpToDate -&gt; DUnknown )
Dec 28 22:31:59 k641 kernel: drbd0: drbdd_init: (mdev-&gt;receiver.t_state !=
Restarting) in /usr/src/drbd-8.0.8/drbd/drbd_receiver.c:3117
    </pre>
  </blockquote>
  <pre wrap=""><!---->
and there you trigger some assertions. "interessting" :)

please provide the kernel log from the "very beginning",
i.e. from drbd0 unconfigured to the first connection attempt.
there should be something about "disk attaching" and "capacity"
and so on ...

also the corresponding (time synchronized) log of the same event
(connection attempt) from the other node.

  </pre>
</blockquote>
<br>
</body>
</html>