イマコト

最新の記事から注目のキーワードをピックアップ!

Article Detail

KDDI研究所、インターネット上の有害情報を高精度に自動識別するシステムを開発

2011-10-28

インターネット上の有害情報を高精度に自動識別するシステムを開発

有害情報の「見た目」と「内容」を分析、識別精度95%を達成


 株式会社KDDI研究所(本社:埼玉県ふじみ野市、代表取締役所長:中島 康之)は、インターネット上にあるWebページや掲示板などの書き込みに含まれる有害情報を柔軟かつ高精度に自動識別する『有害コンテンツ高度識別システム』を開発しました。本システムは、(1)有害情報の「見た目」と「内容」の両方を分析して高精度に識別できる高い識別精度、および、(2)適用先ごとの有害判定基準の違いに配慮し、有害としたい情報を72カテゴリから柔軟に設定できる高い柔軟性を特長とします。

 なお今回の技術は、独立行政法人情報通信研究機構からの委託研究である「インターネット上の違法・有害情報検出技術の研究開発」の研究成果です。


【背景】

 インターネット上のWebページ数の増大に伴い、出会いや犯罪予告などを目的とした有害ページも急増しており、現在、ブラックリスト※1方式や、コンテンツフィルタリング方式※2を代表とした有害情報フィルタが注目されています。特に単語に基づき有害情報を識別するコンテンツフィルタリング方式は、新たなURLであっても識別可能であることが利点であり、近年利用が増加していますが、単語を追加し過ぎると識別誤りも増えるため、必要なレベルまで識別精度が高くならないという課題がありました。また、有害情報フィルタは青少年向けだけでなく、企業のWeb閲覧制限用途にも利用されていますが、この場合、娯楽関連カテゴリも制限対象となる場合もあり、このような判定基準の柔軟な設定が必要とされていました。


【今回の成果】
 このたび、こうした課題を解決するために、有害情報の柔軟かつ高精度な自動識別機能を簡単に利用できる『有害コンテンツ高度識別システム』を開発しました。利用者はまず、判定システムを利用する前に、「誹謗中傷」や「アダルト」「オンラインゲーム」「掲示板」などの72カテゴリの中から有害としたいカテゴリを自由に組み合わせることで、フィルタリング対象を簡単に設定できます。識別精度については、コンテンツに含まれる有害な単語検出やその係り受け※3関係抽出などの精密な「言語的コンテンツ分析」と、判定済みコンテンツとの内容の類似判定や、有害の可能性が高い背景色やリンク先の検出などの高速な「外形的コンテンツ分析」を組み合わせた総合判定により、高精度化を両立することに成功しました。識別精度※4はおよそ95%を実現しています。また、本システムはWebインタフェースを搭載しており、Webブラウザ経由で簡単に利用することができます。


【今後の展望】
 現在、数社と協力して、開発したシステムの実証実験を実施しており、2012年度のサービス開始を予定しています。また本システムを2011年10月26〜28日に幕張メッセ(千葉市美浜区)で開催される第1回情報セキュリティEXPO【秋】のKDDI研究所ブース内に出展致します。

 ※実証実験に参加して頂ける事業者は随時募集中です。(2011年12月末終了予定)


以上

 ※ 用語説明・システムの使い方・システムの機能構成は、関連資料参照

Related Contents

関連書籍

  • 死ぬまでに行きたい! 世界の絶景

    死ぬまでに行きたい! 世界の絶景

    詩歩2013-07-31

    Amazon Kindle版
  • 星空風景 (SKYSCAPE PHOTOBOOK)

    星空風景 (SKYSCAPE PHOTOBOOK)

    前田 徳彦2014-09-02

    Amazon Kindle版
  • ロンドン写真集 (撮影数100):ヨーロッパシリーズ1

    ロンドン写真集 (撮影数100):ヨーロッパシリーズ1

    大久保 明2014-08-12

    Amazon Kindle版
  • BLUE MOMENT

    BLUE MOMENT

    吉村 和敏2007-12-13

    Amazon Kindle版