글쓴이 보관물: 정윤 김

xenserver6.5 랜덤 리붓 원인과 해결.

xenserver6.5가 올해 1월 발표되었고 새로운 버전에 대해 빠르게 적용해보시려고 했던분들은 이미 어느정도 6.5 버전으로 올렸을텐데요

저희도 xenserver6.5버전에 대한 적용전 테스트를 진행하였습니다. 그런데 뜻하지 않은 랜덤 리붓현상이 발생하였습니다… 일정 이상의 파일 이동복사시 해당 현상이 발생하였고 뚜렷한 해결방안이 없어 일시 중단을 했었습니다.

해당 랜던 리붓 현상은 Intel 55×0 chipset errata – Interrupt remapping issue 이슈로 인해 발생했던 문제이며 Intel 5500/5520/X58 chipset이 대상이 됩니다. 해결 방안은 아래와 같습니다.

# xl debug-keys V
# xl dmesg | grep “Interrupt Remapping” 

위 두 명령어를 통해 intel VT-d interrupt Remapping 상태가 enable, disable 여부 확인 합니다.  enable상태로 나온다면  아래와 같이 xen boot 파라미터를 추가합니다.

/boot/extlinux.conf에 “iommu=no-intremap” 추가

/opt/xensource/libexec/xen-cmdline –set-xen iommu=no-intremap

적용 후 리붓 진행을 하게 되면 랜던 리붓 현상이 해결됩니다.

 

xenserver p2v kernel panic 발생 사례

써드아이시스템의 기술지원을 받고 있는 사이트중 물리서버 전체를 가상화로 이전을 원하는 사이트가 있어 P2V 작업을 진행하던 중 centos 4.8 버전에서 PtoV진행 시 아래와 같이 kernel panic 현상이 발생하였다.

FullSizeRender

가상화 하이퍼바이저 엔진과 centos4.8에서 문제로 인해 발생하는 문제로 우선 kernel을 업데이트를 진행하였다.

centos4.8버전은 지원이 종료되어 yum을 이용한 업데이트시 repo파일을 수정해줘야한다.

이후 kernel panic이 해결이 될지 알았으나 이후 새로운 문제로 인해 동일 증상이 발생하였으며 확인 결과 4.8버전의 update된 마지막 커널 버전에서 버그로 인해 panic이 뜬다는것을 확인 하였다.(kernel-2.6.9-100.ELsmp이상에서 발생)

이를 해결하기 위해 리눅스 설치 디스크의 복구 모드로 진입하여 아래의 mkinitrd를 실행한다.

mkinitrd -f -v –with=scsi_mod –with=sd_mod –with=mptbase –with=mptscsi –with=mptspi –with=mptsas –with=mptscsih /boot/<kernel version>.img <kernel version>.EL

이후 정상적인 booting이 진행 되었으며 해당 이슈는 해결 되었다.

해당 문제는 vmware에서는 발생하지 않으며 xenserver에서 발생한다.