2008年10月24日金曜日

ハードディスク 寿命 ハードディスク大量搭載実験研究サイト HDD番長

  • tags: no_tag

    • 1.電源のオン・オフ時の、プラッタとヘッドの接触に伴うヘッド・プラッタの磨耗とその磨耗粒子の飛散に伴う不良セクタの増加
    • ハードディスクのヘッドは、運転中プラッタとほんの少し隙間を空けて浮いている。このヘッドが運転中にプラッタのデータ領域と接触(ヘッドクラッシュ)すればデータ喪失などの大被害をもたらす。
    • 実はプラッタとヘッドは頻繁に接触している。それは電源のオン・オフ時にである。ヘッドはプラッタが回転する際の空気流により浮力を受け浮いているが、プラッタの回転が停止すれば、ヘッドはプラッタと接触する。
    • 2.電源オン・オフや運転状態の変化による温度変化に伴う空気の熱膨張・収縮による、筐体内空気の汚染
    • 3.スピンドルモーターの流体軸受けの劣化
    • 全てが電源のオン・オフと運転開始時に問題が発生するものなので電源を切らなければ寿命は進行しにくいといえる。ただし流体軸受けのオイルやベアリングは運転時間に比例して劣化していく。
    • カーネギーメロン大学のBianca Schroeder Garth A.Gibson両氏による「ディスク故障の現実世界・平均故障間隔100万時間があなたにとって意味するものとは」
      http://www.usenix.org/events/fast07/tech/schroeder/schroeder_html/index.html#Schwarz06
      という論文が発表
    • 異なる環境で使用されている中規模~超大規模なシステム中で使用されているハードディスク10万31台についての1ヶ月から5年間以上の故障交換発生状況を分析している論文
    • ハードディスクとPC内の他の部品の故障率
    • ※サーバシステムに搭載されている電源は我々が使っているものと比べ非常に堅牢で耐久性がある。つまり実際我々が使う電源の故障率は表記数字の何倍にもなる予想が立つが、逆にサーバでは少しの劣化でも検知し交換を要求される。これらのことを勘案すると実際の電源故障率は表記数字の2倍程度ではないかと筆者は考えている。
    • メーカーが発表しているMTTF(注1)はサーバ製品のSCSIドライブで100万時間(114年)以上、我々が通常使用しているIDEやSATAドライブでは40~60万時間(46~68年)と言われているが実際に調べたところこの観察した10万台のハードディスクでは平均で29万時間(33年)であった。(ただしこの数字は使用歴5年未満のハードディスクの故障状況を数値化したもので、実際に33年もつとは言っていない。)また高額なSCSIハードディスクとSATAハードディスクとの違いで故障発生率の有意差は全く認められなかったと言う。
    • 注1※MTTFとはMTBFと同様に平均故障間隔。一般的にMTBFは部品交換により復旧が可能な物品に対して用いられMTTFは例えば電球はフィラメントが切れたら修理できないといった製品に対して用いられる。ハードディスクドライブは一般に修理不能であるのでMTBFとMTTFは同義であると解釈してよい。
    • ハードディスク寿命曲線(従来型)
      • 従来考えられていたハードディスク故障発生率のモデルバスタブ型という - post by boxeur
    • 下に示したグラフは実際の故障台数の使用月数ごとの変化を、ランダムアクセスが頻発するシステムディスクと、ファイルサーバのデータディスクで比較的シーケンシャルアクセスが多いディスクとで分けて示している。
    • ランダムアクセス時におけるハードディスクの故障率
    • シーケンシャルアクセスにおけるハードディスクの故障率
    • ■平坦な期間などどこにも無く、4年目までは順調に故障率が増加する。(2年目からメーカー発表のMTBF値を超えてしまうので、ひいき目に言っても平らな区間は1年しかない。)
      ■ランダムアクセスはシーケンシャルアクセスと比べおよそ2倍の故障発生率になる。
      ■ランダムアクセスが多いハードディスクでは幼児死亡率の高い部分が若干あるが、従来の故障発生率モデルと比べると著しく少ない。

      ■シーケンシャルアクセスが多いハードディスクではそもそも幼児死亡率の高い部分が存在しない。
      ■4年目を過ぎるとむしろ故障発生率が(一時的かも知れないが)減少している。
    • ■実際のMTBFはメーカー発表時間の29%しかない。
      ■長寿命化を図るためにわざわざSCSIハードディスクやSASハードディスクを買う必要は全くない。MTBFの数値が違っていても実際の故障率は同じである。
    • ■熱溜まりや、ファンやハードディスク自身、及び隣接するハードディスクによる振動など、局所的な悪環境により洗礼を受けてしまったハードディスクは4年目までに急速に劣化、故障し、その時点で生き残ったハードディスクはその後の長寿命が期待できるかもしれない。機器全体の中で比較的環境が整ったところであればハードディスクメーカーが発表しているMTBFに近づくかもしれない。
    • 積算使用時間を中心に考えた場合、システムディスクでは1日8時間の使用で11年と、なんとなくリアルな数字が出た

Posted from Diigo. The rest of my favorite links are here.

0 件のコメント: