イマコト

最新の記事から注目のキーワードをピックアップ!

Article Detail

東北大、ゲノム解析情報などを統合する東北メディカル・メガバンク 統合データベースを開発

2016-04-28

世界初、大規模コホートの健康調査情報・ゲノム解析情報等を統合する
東北メディカル・メガバンク 統合データベース「dbTMM」を開発
〜1,070人分の統合された情報を制限付公開開始〜


<発表のポイント>
 ・健康調査及び全ゲノム配列情報を含む生体試料の解析情報を世界で初めて統合したデータベースを開発
 ・宮城県の地域住民コホート参加者1,070人分のデータ、制限付公開を開始
 ・高速かつ高度な検索を可能とする機能を開発
 ・ゲノム医療実現化の推進におけるプラットホームとして期待


【概要】
 東北大学東北メディカル・メガバンク機構(以下、ToMMo)は、宮城・岩手両県で岩手医科大学いわて東北メディカル・メガバンク機構とともに実施している、コホート調査の参加者の健康調査及び解析情報(基本属性情報、調査票情報、生理学検査情報、検体検査情報、診療情報、MRI画像情報、ゲノム・オミックス情報等)を網羅する統合データベース「dbTMM」(The database of Tohoku Medical Megabank)を開発することに成功しました。これら多様なデータを統合して格納する世界初のデータベースです。このデータベースからの最初のリリースとして、1,070人分の基本属性情報、健康調査情報、全ゲノム配列解析情報を、制限付公開(*3)しました。本データベースは、定められた登録・審査の手続きを経て、全国の研究者に利用され、データシェアリングの基盤となります。
 大規模なバイオバンク(*4)は、先進国各国で次世代医療をつくる必須の基盤として構築が進められています。これまで構築されているバイオバンクでは、生体試料とそれに付随する性別、年齢等の基本属性情報や診療情報などを管理しているのが通例です。多くのバイオバンクでは、自らゲノム解析等の大規模な解析は行わず、他の機関である解析センターに生体試料を提供して実施されてきました(*5)。したがって、バイオバンクでは基本属情報や診療情報、検体情報等を管理し、ゲノム情報は他の機関のデータベースに格納される、という別々の管理になることがほとんどです。
 ToMMoでは、複合バイオバンクとして、バイオバンクと解析センター機能を併せ持ち、コホート調査の参加者の健康調査及び生体試料の解析情報の全て、即ち基本属性情報、調査票情報、生理学検査情報、検体検査情報、診療情報、MRI画像情報等のみならず、ゲノム・オミックス情報を網羅する東北メディカル・メガバンク 統合データベース「dbTMM」を開発しました。健康調査及び生体試料の解析情報の、大規模で多種多様な情報を統合することで、診療情報だけでなく、体質(ゲノム・オミックス情報)、体調(検体検査情報、生理学検査情報)、環境要因(調査票情報)などを統合した精確な層別化とフェノタイピングを提供することができ、ゲノム医療実現化の推進のプラットホームとなります。この統合データベース「dbTMM」により、遺伝子と環境が複雑に作用して発症する多因子疾患の病因の解明などを、情報を安全に保ちながら、より多くの研究者が参画して研究が進められるように促進することができると考えています。
 また、今回の最初のリリースでは、「dbTMM」に登録される予定のデータのうち、2013年度のコホート調査参加者1,070人由来の、血液・尿の検体検査情報及び調査票(生活習慣)の回答情報、全ゲノム配列情報を、試料・情報分譲申請審査に基づく制限付公開をしました。


【背景と経緯】
 東北大学と岩手医科大学は、2012年から東日本大震災の被害からの復興事業として、東北メディカル・メガバンク計画に取り組み、東北大学は東北メディカル・メガバンク機構(ToMMo)を、岩手医科大学はいわて東北メディカル・メガバンク機構(IMM)をそれぞれ設立して、事業を進めています。両機構は、宮城・岩手両県の住民15万人を対象にコホート調査を進めており、2016年4月現在で、13万人を超える協力を得ています。
 コホート調査参加者から提供頂いた血液等の試料や調査票は、バイオバンクに格納されて、全国の多くの研究者の利用に供されます(試料・情報分譲)が、東北メディカル・メガバンク計画では多くの試料についてゲノム配列などの解析を両機構により行って、高精度で網羅的な解析データを分譲することを計画してきました。多様な解析により、質や種類の大きく異なる膨大なデータが生み出されますが、それらを効率よく有用な研究の対象とするためには、統合され整理されたデータベースの構築が不可欠です。


【統合データベースの概要】
 統合データベースは、東北メディカル・メガバンク計画のバイオバンク事業において、前向きに収集した大規模な基本属性情報、調査票情報、生理学検査情報、検体検査情報、診療情報、MRI画像情報、ゲノム・オミックス情報等を統合したデータベースです。収集したすべての情報がひとつのデータベースに統合されていることで、あらゆるゲノム情報や健康調査情報や診療情報等に基づく表現型情報の属性でコホートを精確に層別化し、精度の高いゲノム医療実現のための解析研究を実施することができます。研究者は、試料・情報分譲の申請(*6)にあたって、研究計画を立案するために、本バイオバンクにどのような試料・情報があるかを検索し、研究者からの申請と審査に従い、本バイオバンクの統合データベースから情報を抽出・分譲することができます。
 試料・情報分譲審査委員会(*7)における、平成27年度の分譲対象についての決定(*8)にしたがって、2013年度に収集した試料・情報のなかで、データフリーズ(*9)を終えたものを分譲対象とし、2013年度宮城県の地域住民コホート特定健康診査(*10)の、1,070人分の下記の種類の基本情報、健康調査情報、全ゲノム情報を格納した最初のリースを制限付アクセスで公開しました。
 統合データベースは大規模な全ゲノム解析に基づく2,100万の一塩基多様体の情報を格納する、文字通りビッグデータデータベースであり、その能力を有効に活かせるよう高速な検索機能を開発しました。また、基本属性情報、調査票情報、全ゲノム情報など多岐にわたった項目に対して、すべての個別の項目で任意の検索を可能とする検索機能を開発しました。
 統合データベースでは、ゲノムの一塩基多様体情報などの網羅的な解析情報と、調査票に基づく生活習慣、採血に基づく一般検査や医用画像などに由来する従来の健康情報の、両方にわたる検索条件を指定しできます。例えば、特定の染色体の特定の位置で特定の配列をもつ人において、ある生理学検査項目が特定の値以上の人が何人いるか、というような検索も可能になります。
 健康調査情報、全ゲノム情報、診療情報、MRI情報、検体情報等の大規模データを格納するため、セキュリティを担保したデータベースの設計としました。また、検索後に得られる層別化した集団の属性情報について、母集団との有意差解析を実施して、統計学的に母集団と有意差のみられる属性を検定することで、検索後層別化集団の統計学的自動特徴付けを実現しました。大規模データを収載したデータベースの検索では、数千万にものぼるすべての属性情報を表示して確認しながら検索することは不可能です。しかし、この検索後層別化集団の統計学的自動特徴付けの機能により、層別化された集団がどのような特徴のある集団であるかを確認しながら検索することが可能となります。この機能はゲノム・オミックス情報や健康・医療情報の大規模データについて、そのデータの特徴をよく理解する大きな助けとなり、ゲノム医療の研究を進めるうえで、データから得られるヒントとなることが期待されます。
 なお、統合データベースの利用は、試料・情報分譲申請の利用者登録(*11)を行った後、統合データベースの利用申請が必要です。


【今回制限付公開した情報の詳細】
1.基本属性情報 年齢、性別

2.健康調査由来の情報
 (1)血液・尿の検体検査情報
  ・血液学的検査(血球計算,白血球分画等)
  ・免疫学的検査(アレルギー検査等)
  ・生化学的検査
  ・尿検査
 (2)調査票(生活)情報
  ・基本情報・運動について ・飲酒について ・喫煙について ・ストレスについて
  ・家族構成および健康状態について
   −家族構成 −現在の健康状態 −輸血経験、生活習慣病の治療 −罹患歴
  ・体質について ・仕事の状況について ・睡眠について
  ・人とのつながりについて ・東日本大震災の記憶について
  ・東日本大震災での被災と体験について ・女性の健康について
   ただし、自由記載の項目は除外する。
 (3)特定健康診査情報

3.全ゲノム配列情報
 ・個人毎変異情報(一塩基多様体)


【今後の計画】
 今後、本事業の進展にあわせて、格納する対象者と種類の拡大に取り組んでいきます。2016年度以降、段階的に格納する情報の対象者規模と種類を拡大していき、最終的には、15万人分についてのデータベースを完成させて制限付公開する予定です。
 また、格納されるこれらの情報はあまりに大規模であるため、有効に利活用するために大規模データ解析を実施し、その結果を提供していく予定です。そして、このコホートを層別化して利活用するにあたり、体質(ゲノム・オミックス情報)、体調(検体検査情報、生理学検査情報)、環境要因(調査票情報)などを統合したフェノタイピングを実施し、フェノタイプの情報を提供する予定で、これにより、より精度の高いゲノム医療実現の研究を促進することができると考えています。


【用語解説】
 *1. コホート調査:ある特定の人々の集団を一定期間にわたって追跡し、生活習慣などの環境要因・遺伝的要因などと疾病の関係を解明するための調査。

 *2. フェノタイピング:フェノタイプ(表現型)は、一般にある生物のもつ遺伝子型が形質として表現されたものです。ゲノム医療実現に向けた研究におけるフェノタイピングとは、診断病名、検査値、投薬などの診療情報、ゲノム・オミックス情報などを統合して、コホート参加者が罹患した疾患・疾患サブタイプをフェノタイプとして登録すること。

 *3. 制限付公開(制限付アクセス):利用申請の上で許可された場合の公開(アクセス)。

 *4. バイオバンク:生体試料を収集・保管し、研究利用のために提供を行う。東北メディカル・メガバンク計画のバイオバンクは、コホート調査の参加者から血液・尿などの生体試料を集める。

 *5. 例えば、大規模なバイオバンクとして英国のUKバイオバンクが有名だが、UKバイオバンクによって収集された試料のゲノム解析は主に別機関であるサンガー研究所によって担われている。

 *6. 試料・情報分譲の申請:本年度より、データフリーズの終わった検体由来の試料・情報から段階的に分譲を開始している。現在、申請できる資格は、日本の学術研究機関(非営利機関)とそれ以外の日本に本社のある企業等の研究所に所属する研究者。

 *7. 試料・情報分譲審査委員会:2013年、ToMMoは、試料・情報の限定的な利用や外部分譲に向けた仕組み作り、ルール制定・論点整理を行い、本格的試料・情報の分譲開始までのロードマップを作成することを目的とした試料・情報分譲室を設けた。2013年12月に、国内有識者による第1回試料・情報分譲審査委員会を開催し、現在までに8回の委員会が開催されている。

 *8. 2015年度の分譲対象についての決定:2015年度は、以下のような情報が分譲可能。
     1)採血・採尿によって得られた検査結果情報(血球値、白血球分画、生化学検査、総IgE、特異IgE値など)、2)調査票による情報(身長、体重、生活習慣、運動量、飲酒、喫煙、ストレス、家族構成、現在の健康状態、罹患歴、仕事の状況、睡眠、人とのつながり、女性の健康、精神面(K6、CES−D))、3)特定健康診査の結果、4)遺伝子多型情報(一塩基多様体頻度情報、一塩基多様体・変異の個人毎変異情報)

 *9. データフリーズ:対象とするデータについて、ある時点でデータクリーニングをし、固定すること。

 *10. 地域住民コホート特定健康診査:地域住民コホート調査は、宮城県と岩手県の20歳以上の方に健康調査への参加をお願いしている。この調査の一部は、自治体が実施する特定健康診査の会場に、東北大学や岩手医科大学のスタッフが伺い、住民の方々に、本事業・調査について説明の上、同意を頂いた方々から、追加の採血および調査票への記入協力依頼等を行う。

 *11. 試料・情報分譲申請の利用者登録:利用者登録の手順は、バイオバンク試料・情報関連ウェブサイトの「試料・情報分譲申請の流れ」を参照。
      バイオバンク試料・情報関連ウェブサイトhttp://www.dist.megabank.tohoku.ac.jp/

 ※参考図・参考は添付の関連資料を参照



Related Contents

関連書籍

  • 死ぬまでに行きたい! 世界の絶景

    死ぬまでに行きたい! 世界の絶景

    詩歩2013-07-31

    Amazon Kindle版
  • 星空風景 (SKYSCAPE PHOTOBOOK)

    星空風景 (SKYSCAPE PHOTOBOOK)

    前田 徳彦2014-09-02

    Amazon Kindle版
  • ロンドン写真集 (撮影数100):ヨーロッパシリーズ1

    ロンドン写真集 (撮影数100):ヨーロッパシリーズ1

    大久保 明2014-08-12

    Amazon Kindle版
  • BLUE MOMENT

    BLUE MOMENT

    吉村 和敏2007-12-13

    Amazon Kindle版