イマコト

最新の記事から注目のキーワードをピックアップ!

Article Detail

日立など、電子カルテから病態や病気の部位などの情報を高精度に抽出する技術を開発

2014-09-23

電子カルテから病態や病気の部位などの指定された情報を高精度に抽出する技術を開発
欧州研究学会主催の医療情報抽出技術コンペにおいて、日立チームが精度86.8%で総合1位を獲得


 Hitachi India Pvt.Ltd.(社長:飯野 一郎/以下、日立インド)と株式会社日立製作所(執行役社長兼COO:東原 敏昭/以下、日立)は、このたび、インド情報技術大学ハイデラバード校(学長:Prof.P.J.Narayanan/以下、IIIT-H)と共同で、電子カルテから病態や病気の部位などの指定された情報を高精度で抽出する技術を開発しました。この技術を応用することで、医師などが自由形式で記入した文章や既定の書式に記入された検査数値など、さまざまな形式が混在する電子カルテの分析が可能となります。これにより、将来の病気の発症確率の予測をはじめ、さらなる医療サービスの高度化が期待されます。
 なお、本技術は2014年1月から5月にかけて実施された情報検索技術の欧州研究学会CLEF(*1)が主催する医療情報抽出技術コンペ「CLEF e−Health 2014 Task2(*2)」にて、情報抽出精度86.8%で総合1位を獲得しました。また、本技術の内容は2014年9月15日〜18日に英国で開催されるCLEF学会にて発表されます。

 将来の病気の発症確率予測などを行うには、血液検査結果などの既定フォーマットに入力された情報に加え、医師が記入した電子カルテを分析して得られた情報の活用が必要です。しかし、電子カルテは、医師によってさまざまな表現で記入されるため、必要な医療情報を抽出する技術が必要であり、多くの機関で研究開発が行われています。

 本コンペは、多くの医療専門用語を含む電子カルテを患者などが読めるようにすることを目的に2013年から開催されているもので、技術内容によってTask1からTask3に分かれて競われます。日立インド、日立とIIIT-Hが参加した医療情報抽出精度を競うTask2には、2014年は企業や大学などの10団体が参加しました。Task2では、電子カルテから、病気の部位や病態などの医療情報を高精度で抽出する技術が競われ、日立インドと日立、IIIT-Hは抽出精度86.8%で総合1位を獲得しました。今回、開発した技術の概要は以下の通りです。

1.判定規則を自動構築する機械学習技術

 対象情報の抽出精度を向上させるため、あらかじめ用意した学習データに基づき、電子カルテに記入された情報から答えを判定する規則を自動構築する機械学習手法を導入しました。さらに文中の情報に加え、電子カルテの章や節タイトルなどの文書構造に関するテキスト情報も考慮することで精度を向上させました。

2.文脈考慮による後処理技術

 機械学習手法で抽出された情報の精度をさらに高めるため、2つの後処理技術を追加しました。最初の処理では抽出された語句の前後の文脈を考慮することで、より正確な情報に変換します。次の処理では、心電図検査所見や放射線検査所見など、電子カルテの種類を判別し、その種類に適した医療用辞書を用いることで曖昧な単語の意味を決定します。これらの後処理の導入により、機械学習手法だけでは60%だった病気部位の抽出精度を74%にまで向上させることができました。

 また、本技術の開発では、オープンソースの医療テキスト解析プログラムApache cTAKES(*3)を活用することで、研究開発の効率を高めるとともに将来の機能拡張が容易になりました。

 日立インドと日立は、今回開発した技術の抽出精度をさらに向上させるとともに、本技術を応用して医療サービスの高度化につながる技術開発を進めていきます。


<用語>
 *1 CLEF(Conference and Labs of the Evaluation Forum)は情報抽出や可視化などの情報アクセス技術の研究促進を目的とした欧州の学会組織であり、CLEF e−Healthのような技術コンペの実施と年次カンファレンスを主催しています。今年の技術コンペではCLEF e−Healthの他に、ニュース記事推薦や画像認識など8件が実施されました。
 >http://www.clef-initiative.eu/home

 *2 CLEF e−Health 2014は電子カルテからの情報アクセス技術の開発を目的とした技術コンペで、3つのタスクに分かれます。Task1は電子カルテを患者に見やすく表示する技術に関して、Task2は電子カルテから病気に関する情報を抽出する技術に関して、Task3は病気に関する情報を大量の文書の中から検索する技術に関して競われます。
 >http://clefehealth2014.dcu.ie/

 *3 Apache cTAKES (clinical Text Analysis and Knowledge Extraction System)はオープンソースで提供されている自然言語処理プログラムであり、医療関係の英語テキストを対象としてさまざまな情報を解析することができます。
 >http://ctakes.apache.org/


以上


Related Contents

関連書籍

  • 死ぬまでに行きたい! 世界の絶景

    死ぬまでに行きたい! 世界の絶景

    詩歩2013-07-31

    Amazon Kindle版
  • 星空風景 (SKYSCAPE PHOTOBOOK)

    星空風景 (SKYSCAPE PHOTOBOOK)

    前田 徳彦2014-09-02

    Amazon Kindle版
  • ロンドン写真集 (撮影数100):ヨーロッパシリーズ1

    ロンドン写真集 (撮影数100):ヨーロッパシリーズ1

    大久保 明2014-08-12

    Amazon Kindle版
  • BLUE MOMENT

    BLUE MOMENT

    吉村 和敏2007-12-13

    Amazon Kindle版