Article Detail
NTT、60P/120P同時伝送対応のHEVCソフトウェアエンコードエンジンを開発
超高精細映像の60P/120P同時伝送に対応した
HEVCソフトウェアエンコードエンジンを世界に先駆けて開発
〜NTT−ATからSDK,トランスコーダアプリケーションを発売〜
日本電信電話株式会社(以下NTT、本社:東京都千代田区、代表取締役社長:鵜浦 博夫)は、現在4K配信で利用されている秒間60フレームの映像と、秒間120フレームの超高精細な映像を同時に伝送可能な、国際標準規格「H.265/HEVC(High Efficiency Video Coding)」(以下、HEVC)準拠のソフトウェアエンコードエンジンを世界に先駆けて開発しました。
本機能により符号化を行うと、将来的に秒間120フレームの映像の配信が開始された場合に、既存のテレビ等でも秒間60フレームの映像として試聴することができ、スムーズな移行を可能とします。また、新たな高圧縮技術の導入により、従来と同等画質で約40%のデータ量削減を実現しており、現在の配信サービスにおいても、蓄積コストの削減などが期待できます。
本技術は、NTTアドバンステクノロジ株式会社(以下NTT−AT、本社:神奈川県川崎市幸区、代表取締役社長:木村 丈治)が取得し、ソフトウェアコーデック開発キット「HEVC−1000 SDK」および、ファイルコンバートソフトウェア「RealFeel(リアフィール) FileConvert 4K」をバージョンアップし販売開始いたします。
なお本技術は、7月8日〜10日まで幕張メッセで開催される「第2回ライブ&イベント産業展」のNTTビズリンクブース(ブース番号3−22)にて、イベント映像配信の将来像として展示いたします。
1.背景・目的
高精細な4K映像配信サービスが商用化される中、将来的にはスポーツ映像など被写体の動きが激しい映像に適した秒間120フレームの4K/8K映像の配信が検討されています。秒間120フレームの映像を配信する際、既存の秒間60フレームのみに対応したデコーダーにおいても視聴可能にするため、ARIB(※1)による標準規格であるSTD−B32(※2)において時間方向階層符号化が規定されています。時間方向階層符号化においては、各フレームレートそれぞれに異なるビットレートが設定されるため、精度の良い符号量推定技術が求められます。
また、本格的な4K映像配信の開始により、コンテンツも年々増加してきています。解像度、フレームレートの拡張とともに、データ量が膨大となっており、設備増設のコストの圧縮などのためにも、映像の圧縮が求められており、H.265/HEVCエンコーダーの圧縮性能の向上が期待されています。
2.技術のポイント
<1>時間方向階層符号化機能(図1)
本ソフトウェアエンコードエンジンでは、ARIBにより規定された時間方向階層符号化に、世界に先駆けて対応しました。時間方向階層符号化では、秒間120フレームの映像の中から、部分的にフレームを取り出せるように符号化します。符号化を行う際には、各フレームを分析し符号量の推定を行います。時間方向階層符号化において、この符号量推定の精度が低いと、各フレームレートへの符号量の割り当てが最適化されず、全体の画質の低下する可能性があります。NTTでは、各フレームの要素を分解し分析することによって、符号量の推定精度を向上させ、効率的に符号量を割り当てる技術を開発しました。
図1 NTTの符号量制御技術により、120Pおよび60Pのストリームそれぞれに設定されたビットレート(M、N bps)を考慮しつつも、安定した画質を実現。
*図1は添付の関連資料を参照
<2>可変ビットレートに対応した符号量制御技術(図2)
映像を蓄積し配信するサービスにおいては、配信ビットレートを固定して制御する固定ビットレート制御(CBR:Constant Bit Rate)方式だけではなく、符号量の割り当てを可変にし、全体の符号量の削減が可能な可変ビットレート制御(VBR:Variable Bit Rate)も注目されています。VBRでは、映像の複雑度に応じて、符号量を変化させる際に、デコードに必要な様々な条件を考慮する必要があります。NTTが開発した精度の高い符号量推定技術を応用することで、複数の条件の組み合わせに対して高い精度で符号量を推定し、効率的に符号量を割り当てることが出来るようになりました。その結果、固定ビットレートの場合と比較して40%のデータ量削減を実現しました。
図2 映像の複雑度に対する特徴を分析しながら、目標ビットレートおよび、デコード時に考慮すべき各種条件を同時に満たしながら、符号量を割り当てる制御方式を開発。
*図2は添付の関連資料を参照
3.本技術の展開について
昨年開発したソフトウェアエンコードエンジンは、NTT−ATより販売している、ソフトウェア開発キットおよび、ファイルコンバートソフトウェアを通じて、H.265/HEVCへのファイルトランスコード用途として、機器メーカ様からポストプロダクション様、配信事業者様など多くの方々にご利用いただいております。今回開発した技術をこれらの商品にいち早く組み込むことにより、将来的に計画されている4K/8K 120P映像に対する検証等の準備を、早期に開始できるとともに、既存のHD映像、4K映像の圧縮率の向上にも貢献することができます。
※1 一般社団法人 電波産業協会
※2 ARIB 標準規格「デジタル放送における映像符号化、音声符号化及び多重化方式」
[別紙1]<NTT−AT>HEVCソフトウェアコーデック開発キット「HEVC−1000 SDK」
ファイルコンバートソフトウェア「RealFeel FileConvert 4K」について
■商品の概要
NTT−ATは、これまでも映像圧縮技術を生かしたソフトウェアコーデック「RealFeel」シリーズを発売し、販売実績を重ねてきました。NTT−ATは、NTTメディアインテリジェンス研究所にて開発された、世界最高レベルの圧縮性能を持ち、秒間60フレームと秒間120フレームの超高精細映像を同時に伝送可能なHEVCソフトウェアエンコードエンジンを採用した同「RealFeel」シリーズ「HEVC−1000 SDK」と「FileConvert 4K」を2015年7月末にバージョンアップし販売を開始します。
1.HEVCソフトウェアコーデック開発キット 「HEVC−1000 SDK」
エンコーダーとデコーダーがセットになったソフトウェアコーデック開発キットです。映像データの圧縮方法の変換やビットレートの変換を行うファイルコンバートソフトウェアや映像データを編集するためのオーサリングソフトなどへの組み込みに活用いただいています。
今回のバージョンアップで、以下の機能が追加され、モバイル配信での低ビットレートで高画質な映像配信や高フレームレートでの次世代映像配信にもご活用いただけます。
●2パスVBR(※1)機能の搭載により、高圧縮なエンコードを実現し、低ビットレート配信が可能になりました。
●ARIB規格の時間方向階層符号化、フィールドペア符号化に対応しました。
●予測モードの決定アルゴリズムの効率化によりエンコード処理を高速化しました。
※1:2パスVBR…可変ビットレートによる符号量制御技術を使い、一度エンコード処理を行い全体のデータの複雑さを解析し、それにあわせてビットレートを再調整することで、より高圧縮で高画質なエンコードをする方式。
2.ファイルコンバートソフトウェア 「RealFeel FileConvert 4K」
ファイルコンバートソフトウェアで、主要な映像メディア形式を入力することができます。標準解像度から4Kまでのさまざまなコンテンツを、マルチデバイス向け配信フォーマット(MPEG−DASH、HTTPライブストリーミング、スムースストリーミングなど)にも変換することができ、IP回線環境でのコンテンツ配信などにご利用いただいています。
今回のバージョンアップにより、圧縮性能およびエンコード速度のさらなる向上を図り、増加する4Kコンテンツに対するエンコード時間を削減し、ポストプロダクションや配信事業者のご要望にお応えします。
■今後の予定
2015年8月末に、「RealFeel FileConvert 4K」は、秒間60フレームの高画質4Kコンテンツを12〜15Mbpsといった低ビットレートで圧縮可能な2パスVBR機能や高臨場感を伝えるための音声フォーマットとして期待されるロスレス圧縮(可逆圧縮)方式であるALS(Audio Lossless)にも対応を予定しています。