Article Detail
富士通研究所、ディスクの多重故障に対応した高速リカバリ方式を開発
ディスクの多重故障に対応した高速リカバリ方式を開発
故障復旧時間を従来より約20%以上短縮してコンテンツデータ消失の危険性を低減
株式会社富士通研究所(注1)は、ストレージにおける重要コンテンツの消失対策として、多重故障時でも対応可能でディスク障害からの復旧時間が短いリカバリ方式を開発しました。
障害からデータを守る技術としてRAID(注2)が広く用いられていますが、Webサービスなどで利用されるコンテンツのデータ蓄積量は爆発的に増加する傾向にあり、ディスク故障時の消失データ復旧の長時間化が問題となっています。
今回、データの消失を保護する冗長データをディスク上のデータの塊であるデータブロックのグループごとに管理する独自構成を考案しました。これを用いて、従来どおりのディスク故障への耐性を保ちながら、例えばディスク2台が同時に停止するような多重故障に対して、容量効率とのトレードオフを利用シーンに応じて自由に選択しながら、復旧時間を従来より約20%以上短縮できる新しい高速リカバリ方式を開発しました。
これにより、クラウドサービスやWebサービスの拡大で増加するコンテンツを格納したストレージに対する障害復旧を迅速に実施できます。
本技術の詳細は、10月5日(日曜日)に米国コロラドで開催された国際学会「USENIX HotDep’14」にて発表しました。
■開発の背景
近年、Webサービスなどで中心的な役割を果たすコンテンツデータが、年率70%を超える速度で爆発的に増加しています。そのサービスにおける重要性により、コンテンツデータの消失対策として、例えば三重のコピーを持つ方式が取られることがありますが、コンテンツの容量増加に対応するストレージの増量に伴うコスト増が無視できなくなっています。三重コピーは保護したいデータの3倍のストレージが必要となるため、容量効率を上げるために、近年では企業の基幹データ保護などで古くから用いられているRAID技術が見直されています。各データをコピーで保護する代わりに、複数データをまとめて保護する冗長データ(パリティ)を導入することで、三重コピーよりも大幅に少ない冗長データで同等のデータ保護が可能です(図1)。
※図1は添付の関連資料を参照
■課題
現在広く普及しているRAID5やRAID6などの標準的なRAIDの技術では、全てのパリティが全データを保護する方式が用いられています。あるディスクが故障した際に、そのディスクに格納された各データを保護するパリティに加え、残存データをすべて使って消失データを復旧する必要があるため、膨大なデータ転送による復旧の長時間化や、復旧中のデータ消失のリスクが増大することが問題となっていました(図2)。例えば、毎秒15MB(メガバイト)のランダムI/O性能で4TB(テラバイト)の容量を持つディスクを48個用いた場合、ディスク2台の同時故障からの復旧に10時間以上かかる計算になります。
※図2は添付の関連資料を参照
■開発した技術
※添付の関連資料を参照
■効果
今回開発した技術を用いることで、データ量が爆発的に増加しているWebコンテンツなどのデータを蓄積しながら、そのディスク故障からの復旧を高速に行うことが可能となります。これにより、クラウドサービスやWebサービスの拡大で増加するコンテンツを格納したストレージに対する障害復旧を迅速に実施できます。
■今後
富士通研究所では、本コンテンツリカバリ技術のさらなる改良をすすめ、2015年度中の実用化を目指します。
■商標について
記載されている製品名などの固有名詞は、各社の商標または登録商標です。
以上
<注釈>
注1 株式会社富士通研究所:
代表取締役社長 佐相秀幸、本社 神奈川県川崎市。
注2 RAID:
Redundant Array of Inexpensive Disksの略。データを複数のハードディスクに分散し、性能と耐障害性を同時に確保するための技術。