先日、kitaguniサーバは、訳あってlennyになってしまったのですが、
もう一台ある(ほぼ)同じ構成のサーバをlennyにしました。
本当は、予備サーバにもなっているので、同じ構成でいる事が望ましいのですが。
きっかけは、予備側からレポートが届かないので、いくつか調べているうちに、
/proc/mdstatを見ると、raid5の1台が止まっていたことから始まります。
このサーバ、(メインも同じだけど)、/dev/sdaが/bootと/とswap。
/dev/sd[bcd]でraid5を組んで、/homeになっています。
smartctlのレポートを見ると、sdbではいくつかトラブルが出ているようですが、
raidから外されたsddでは、特に問題なし。
という事で、sddを入れ直してみました。
が、再構築の終わった翌日、またspareになっている。
しかも、mdadm -E /dev/sd[bcd]で、それぞれ違う事を言ってる。(^^;
調べてみると、何となく、カーネルの問題か?
それとも、以前に試してみた、本体側のハードウエアRAIDを試した時の
残りかすが残っているのか?
(ML115は、標準でオンボードRAIDが入っているのですが、
試してみた結果では、OSでRAIDを組んだ方のが速かったのです。
どうせ、ホットスワップ出来ない仕様だし。)
そこから大変な作業になり、/homeがないままaptitude dist-upgrade
(その前に、いろいろ準備がありますが)で、lennyに。
で、一応安定した事を確認して、
(いくつかのサーバが/homeを必要とするので完全ではありませんが)
mdadm -A /dev/md0 -u <uuid> --run --force
で、強制的にmd0を再構成。
すると(多分、mdadmが適当にsd[bcd]のスーパーブロックを解釈して)、なんとか復旧。
復旧後、マウントして、なんとなく全データが残っている事を確認してから、
メインサーバにバックアップ。(^^;
再度RAIDを作り直して、また書き戻し。
この予備サーバは、メインのバックアップ用と、ネットワーク支援用に使っているので、
中身が無くなっても、それほど困らないのですが、また設定するのが面倒なので。
カーネルも新しくなった所で再起動。
すると、apacheが起動しません。
正確には、CPUほぼ100%消費して起動処理中で、ログも吐かずにそのままです。
ログレベルをdebugにしても、何も記録されない。
a2dismodで怪しそうなモジュールを外していくと、phpを外した所で、正常起動。
原因は、phpでした。
aptitude search phpを見てみると、php4とphp5が一緒に存在している。
多分、同時に存在していても問題ないのでしょうが、php4を削除して、apacheモジュールを組み込み直す。
それでも起動しない。
面倒なので、php4と5を含め、php関係をすべてpurgeしました。
それから、改めてphp5をinstall。
これで、なんとか起動完了。
と、長い3日間でした。(^^;
コメントする