メニュー 閉じる

日: 2010年5月14日

ESXi4/D510MOその後(深まる謎)

こんばんわっ!
気温変化についていけなくて体調崩してるみくりん☆ですorz
皆さん大丈夫ですかー?

#なんか今週はダウンしてるひとが多いような…^^;

えーと、まあ最近いろいろ忙しかったのでブログ更新とかできてなかったんですが、ようやくまたD510MOをいじれたので、その後の報告ってな感じです。

■RTL8111 on Intel D510MOの謎。

前回記事で、ESXi4を導入して試行錯誤してたんですが、結局NWに負荷を掛け続けるとネットワークが切れちゃうんですね。

でも、この問題が発生するのは今のところ、

・Ubuntu系Linux
・ESXi4系ハイパーバイザ(ベースはLinuxですね)

あたりの事例が多いようです。
他では調べた範囲では問題なさそうな雰囲気。
(Windows入れてる方は見かけませんので不明ですが…)

一方で、動作がうまく行っていて問題が出ない(NWが切れない)のは、

・CentOS 5.4

ですね。(5.5とかは出たばっかりなので試せてません…)
おそらくRHEL5.4とかも、ソースは一緒なので大丈夫なんじゃないかと思います。

で…

▼なぜ RTL8111D ドライバの自動判別に失敗するのか
http://d.hatena.ne.jp/metastable/20100211/1265885917

この問題がまず頭にあり…。
(つまりRTL8168/8111系のチップに対してRTL8169のドライバが使われちゃうから問題、って情報なんですけども。)

これがとても気になっているんですが…
正常動作しているCentOS5.4環境では、lsmodしてみると、なんとRTL8169のドライバで動いています。
同じマザーボード2枚使ってますが、どちらも症状が出ません。
(24時間データ転送し続けてもNWが切れません。)

じゃあ何が問題か…というと、カーネルなのかなぁ?という感じがしてきました。
CentOS 5.4でyum updateして最新状態にしたカーネルは、

# uname -a
Linux hostname 2.6.18-164.el5PAE #1 SMP Thu Sep 3 04:10:44 EDT 2009 i686 i686 i386 GNU/Linux

(↑32bitです)
と、「2.6.18」ベースのカーネルを使っている模様。

いちおう最新(最近)のカーネルソース(2.6.33.2)を持ってきて、付属していたRTL8169のドライバソースを眺めてみましたが…よくわからず。
これをCentOS 5.4のカーネルソースと比較してみると何かわかるかもしれませんが、さすがにそこまではできていません。

#今ちょうどCentOS 5.4を入れたので、kernel-develを突っ込んでRTL8169のソースがあればdiffでもかけてみようかな。。

少なくとも、RealtekのソースコードからビルドしたものをESXi4 Update1で動かした範囲ではどうやっても問題が発生したので、うまく動かすヒントは2.6.18のカーネルに付属のRealtek系ドライバソースにあるかも。

カーネルのconfigでもRTL8169のドライバパラメータはあれど、RTL8168/8111系のパラメータはないし、一般的には上記の問題と関係なくRTL8169のドライバで動くのかもしれません。

Amebloのほうで、サウスチップが怪しいという情報をコメントでいただいたものの、ちゃんと動いちゃう事例があるので謎は深まるばかり。。

あとはESXi4もUpdate1は不安定?という(ソース不明)情報もいただいてますので、時間が許せば、バージョン落として古いほうのESXi4.0.0を入れてみるとまた挙動が違うかもしれません。

うーん、時間がほしいな。
とりあえず当面はCentOSベースで使う予定です…。

まあ気が向いたらまた検証してみます。^^;