Article Detail
東大と日立、ヒトゲノム解析用スーパーコンピューターShirokane3の本格稼働を開始
東大医科研がヒトゲノム解析用スーパーコンピュータShirokane3の本格稼働を開始
従来比約10倍の解析速度と約100万人分のデータ保存を実現し、
がんや感染症などに関する個人の特性に合った予防・診断・治療法の研究を加速
■発表のポイント
・東京大学 医科学研究所 ヒトゲノム解析センターは、株式会社日立製作所の協力のもと、ヒトゲノム解析用スーパーコンピュータシステムを刷新し、Shirokane3として4月1日から本格稼働を開始します。
・422 TFLOPSの総合理論演算性能の実現などにより、従来システム比約10倍の速度でヒトゲノムのデータを解析することが可能となります。
・膨大なデータからヒトゲノムが変異した箇所を高速に検索・特定することにより、ヒトゲノム変異と疾患要因の因果関係分析や治療効果の高い医薬品の予測など、最適な治療法の研究を効率化します。
■概要
東京大学 医科学研究所(所長:清野 宏/以下、東大医科研)ヒトゲノム解析センターは、このたび、ヒトゲノム解析(注1)用スーパーコンピュータシステムを刷新し、これをShirokane3と命名し、4月1日から本格稼働を開始します。
Shirokane3は、従来システム比約10倍(*)の速度でヒトゲノム情報の解析を実現するとともに、大容量のストレージ装置により従来システム比約33倍の約100万人分(**)のデータを保存することができます。今回の稼働により、膨大なデータからヒトゲノムが変異した箇所を高速に検索・特定し、ヒトゲノム変異と疾患要因の因果関係分析や、治療効果の高い医薬品の予測を行うことが可能となります。これにより、東大医科研ヒトゲノム解析センターは個人のヒトゲノムの特徴に応じたがんや感染症などの予防・診断・治療法の研究を加速し、個人の特性に応じた個別化医療の実現をめざします。
なお、Shirokane3は株式会社日立製作所(執行役社長兼COO:東原 敏昭/以下、日立)が構築し、今後の安定稼働を支援します。
■Shirokane3の導入と今後の研究
東大医科研は、日本におけるヒトゲノム解析を通じた医学・生物学研究の中心拠点であるヒトゲノム解析センターを有し、従来システムでは日本人の全ヒトゲノム配列(注2)の解析を世界で初めて(***)行うなど、ヒトゲノム分野の先進的な研究を推進してきました。ヒトゲノム研究においては、近年のDNAシークエンサ(注3)の技術発展により大量のヒトゲノム情報を高速に取得することが容易となり、解析技術の高度化も進展しています。こうした中、東大医科研ヒトゲノム解析センターは、ますます増加する膨大なヒトゲノム情報をより効率的に解析し、個別化医療の実現に向けた研究を加速することを目的として、ライフサイエンス分野におけるスーパーコンピュータシステムの構築・運用に関する多くの実績を有する日立の協力のもと、Shirokane3を導入します。
なお、Shirokane3は東大医科研に所属する研究者のほか、従来システムと同じく国内他機関の研究者や医療関係者による利用も可能とすることで、ヒトゲノム研究の社会的な発展に寄与します。
また日立は、今回のシステム構築にあたりシステムの稼働状況を監視する機能を開発しました。本機能は、システムにかかる負荷をリアルタイムに監視し、効率的な分散処理を行うことでシステム障害の発生を防止するものです。また、Shirokane3は用途に応じてシステム構成を柔軟に変更することが可能です。例えば、ヒトゲノム解析に関する国際プロジェクトを実施する際、海外の研究機関とヒトゲノム解析手法やシステム構成などを共通化する必要がある場合も、迅速に対応することができます。
■スーパーコンピュータシステムShirokane3の特長と構成
1.ヒトゲノム情報の高速な解析と大量データ保存を実現
Shirokane3では、422 TFLOPS(注4)の総合理論演算性能(注5)を実現しています。具体的には、ヒトゲノム情報の高速な並列処理を行うプログラム用には合計11,160CPUコアを有する「分散メモリ型サーバ」、ヒトゲノムアセンブリプログラムといった大容量のメモリを必要とするプログラム用には1ノード(注6)あたり2TB(注7)のメモリ容量を有する「大規模メモリサーバ」を有しています。また、ストレージは、本格稼働の開始時点で、合計34.2PB(注8)の記憶容量を有し、適時の増量が容易にできる構成にしています。具体的には、膨大なヒトゲノム情報の高速な解析を行うため、すべてのサーバ間と大量のデータを高速に送受信できる「高速ディスクアレイ装置」や、ヒトゲノム情報を格納するための大容量の「分散ストレージ」と「巨大アーカイブストレージ」で構成し、これらは、100PBを超える容量まで増量できるハードウェアを備えます。
2.電力消費の効率化
Shirokane3では環境に配慮したシステム運用により、東京大学サステイナブルキャンパスプロジェクト(TSCP)(注9)の取り組みである、低炭素キャンパスづくりの推進に寄与します。具体的には、国内の大学・研究機関のスーパーコンピュータシステムでの採用は初(***)となる間接蒸発式冷却装置(注10)により、優れたエネルギー効率を実現する超低電力冷却システムなどを採用することでPUE(注11)の試算値を1.06と見込んでいます。
3.高セキュリティ
ヒトゲノムを扱った研究においては、ヒトゲノム所有者の個人情報を厳重に管理するため、セキュリティを確保した上で、必要に応じて研究者やシステム運用者がヒトゲノム情報を元に個人を特定できないよう、匿名化の手続きを行っています。あわせて、東大医科研ヒトゲノム解析センターでは、ヒトゲノム情報を扱うシステム領域を外部のインターネットと完全に隔離し、ログイン認証に生体認証を採用する高セキュリティ領域を確保しています。
■スーパーコンピュータシステムShirokane3のイメージ
※添付の関連資料を参照
■用語解説
(注1)ヒトゲノム解析
生物の持つすべての遺伝情報のセットであるヒトゲノムの構造や機能を解析すること。
(注2)ヒトゲノム配列
各染色体を構成する塩基の配列で、遺伝情報を表す。
(注3)DNAシークエンサ
化学処理したDNAサンプルに対してさまざまな分析処理を行うことで、ヒトゲノムのDNA塩基配列を自動的に読み取る装置。
(注4)TFLOPS(テラフロップス)
1TFLOPSは浮動小数点演算を1秒間に1兆回実行する能力。
(注5)総合理論演算性能
同時に動作可能な全ての演算器が動作したときの理論上の性能。
(注6)ノード
システムを構成する独立した演算処理単位で、サーバを意味する。
(注7)TB(テラバイト)
約1,000Gバイト。約1兆バイト。
(注8)PB(ぺタバイト)
約1,000Tバイト。約1,000兆バイト。
(注9)東京大学サステイナブルキャンパスプロジェクト(TSCP)
地球環境を保全しつつ産業発展や研究開発が継続可能な社会の実現に向け、先導的な取り組みを実践する取組みであり、キャンパスからの温室効果ガス排出削減を当面の最優先課題としている。
(注10)間接蒸発式冷却装置
室内の空気の熱を外気と混ぜずに水をかけた熱交換器を介して外気に放出する冷却装置。
(注11)PUE(Power Usage Effectiveness)
データセンターやサーバ室のエネルギー効率を示す指標の1つで、データセンター全体の消費電力をIT機器の消費電力で除した値。PUE値が1に近づくほど、エネルギー効率が高いことを表す。
■注釈
(*)従来システムのShirokane1からの演算性能、ネットワークなどの向上を総合的に評価した推定値
(**)1人分のヒトゲノムあたりの解析に必要なデータ量を100GB程度とした場合
(***)東大医科研調べ