Hi,<br><br>I moved my Proxmox cluster - consisting essentially of two<br>physical servers, two Cisco NAS units where the (KVM) VM images<br>live and two switches, to a new data centre where they now have<br>new IP addresses.<br>
<br>I reconfigured basic networking on the two servers, updated the<br>IP addresses in the Proxmox config and rebooted the boxes, master<br>node first.<br><br>The storage is set up as /dev/drbdvg0 and /dev/drbdvg1. I didn&#39;t<br>
install this myself and I&#39;m not that familiar with DRBD or indeed<br>iSCSI. Both are used to store KVM guest virtual machine images,<br>seen by both servers.<br><br>Everything looked fine, until I attempted to start a VM on the<br>
second (slave) node. It took ages to start, hanging for thirty<br>seconds at a time. It was clearly miscommunicating with the NAS.<br><br>All of the images, including those set up on the second node,<br>will run fine on the first (and that&#39;s what I&#39;m doing for now).<br>
<br>So the first (master) box has excellent access to the NAS, while<br>the second (slave) has trouble reading from it.<br><br>On the first box, /proc/drbd looks like this:<br><br>version: 8.3.7 (api:88/proto:86-91)<br>srcversion: EE47D8BF18AC166BE219757<br>
 0: cs:WFConnection ro:Primary/Unknown ds:UpToDate/DUnknown C r----<br>    ns:0 nr:0 dw:27568823 dr:156762105 al:309656 bm:309639 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:10184632<br> 1: cs:WFConnection ro:Primary/Unknown ds:UpToDate/DUnknown C r----<br>
    ns:0 nr:0 dw:2451648 dr:14918745 al:1244 bm:1211 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:1152564<br><br>And on the second, troublesome box:<br><br>version: 8.3.7 (api:88/proto:86-91)<br>srcversion: EE47D8BF18AC166BE219757<br>
 0: cs:StandAlone ro:Primary/Unknown ds:UpToDate/DUnknown   r----<br>    ns:0 nr:0 dw:0 dr:1705944 al:0 bm:107 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:954596<br> 1: cs:StandAlone ro:Primary/Unknown ds:UpToDate/DUnknown   r----<br>
    ns:0 nr:0 dw:0 dr:1821288 al:0 bm:107 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:520192<br><br><br>So it looks like at some level they aren&#39;t talking to each other<br>- I don&#39;t see the usual &quot;UpToDate/UpToDate&quot;.<br>
<br>I&#39;m also seeing lots of messages like this on the second node:<br><br>  connection1:0: ping timeout of 5 secs expired, recv timeout 5,<br>  last rx 4329026692, last ping 4329027942, now 4329029192<br>  connection1:0: detected conn error (1011)<br>
<br>Can anyone suggest what might have gone wrong here? A cabling<br>issue maybe? Or how to fix it? I&#39;m particular anxious to avoid <br>losing updates to the images as seen by the first node if they<br>manage to sync up - don&#39;t want to lose or corrupt the VM images!<br>
<br>I inherited this setup and I&#39;m not that familiar with DRBD, though<br>keen to learn. Very grateful for any advice.<br><br>Thanks,<br>James<br><br><br>