電子情報通信学会 - IEICE会誌 試し読みサイト
© Copyright IEICE. All rights reserved.
|
画像工学研究専門委員会
VVC(Versatile Video Coding)
Versatile Video Coding(VVC, ISO/IEC 23090-3|8-2|ITU-T H. 265)の後継にあたる規格である.近年,動画像における高精細化や広ダイナミックレンジ(HDR)化,広色域化に対応した新たなフォーマットに加え,新たな映像体験として普及が始まっているVR(Virtual Reality)サービスでの利用が想定される,全天周映像(360°映像)への対応の必要性が高まっていることから,JVETは2017年10月に後継の映像符号化方式のCall for Proposals(技術募集)を発行し,規格名称をISO/IEC 23090-3 MPEG-I Part-3 Versatile Video Codingとして標準化を開始した.
HEVCの標準化では,第一版で放送やストリーミングで利用される4:2:0色差フォーマットを主なターゲットとして標準化が進められ,制作や編集などで用いられる4:2:2,4:4:4などの色差フォーマットの符号化は拡張規格での対応となっていた.また,アニメーションやCGなどのスクリーンコンテンツ符号化機能や異なる解像度の複数の映像を符号化する空間スケーラブル符号化機能も拡張規格でのサポートであった.
一方VVCは,第一版からこれら全ての色差フォーマットや機能に対応している.HDRや360°映像を効率的に符号化するツールも採用されており,VVCはその名前に「多用途(Versatility)」が含まれているように,符号化効率の向上だけではなく,多様な用途に利用できるよう標準化が進められたことが伺える.VVCの第一版は2020年7月に承認され,その後2022年4月には主に医用画像分野で用いられる高ビット深度・高ビットレート符号化機能の拡張が承認されている.
VVCはその前身であるHEVCと同様にブロックベースのハイブリッド符号化方式である.ハイブリッド符号化方式は,原画像に対するブロック分割,分割されたブロックに対するイントラ予測・インタ予測,原画像のブロックと予測画像との差分に対する変換・量子化処理によって構成される.表1に示すように,VVCはイントラ予測の方向予測モード数の増加や,インタ予測の動き予測補償の少数画素精度の向上など,既存の符号化ツールの拡張のほか,復号器側での動きベクトル補正や適応ループフィルタなど,新たな符号化ツールが多数導入されている.
プロファイルとは,特定の用途のために用いられる符号化ツールセットである.第一版では,色差フォーマットが4:2:0,ビット深度が10bitの,最も汎用的に用いられる映像フォーマットを対象としたMain 10プロファイルのほか,色差フォーマットが4:2:2や4:4:4の映像を対象としたMain 10 4:4:4プロファイル,スケーラブル機能やマルチビュー機能などを実現する複数の映像を符号化するためのMultilayer Main 10プロファイルなどを含む六つのプロファイルが規定された.第二版では,12bitや16bitなどの高ビット深度映像の符号化に対応するため,九つのプロファイルが追加で規定された.
レベルは復号器の処理能力を示す目安であり,ビットストリームの解像度やフレームレート,ビットレートなどを制限する.HEVCと同様に,最大ビットレートと最大Coded Picture Buffer(CPB)サイズによる復号能力の違いを示すためtierという概念を導入しており,主にコンシューマ用途向けのMain tierとプロフェッショナル用途向けのHigh tierに分かれている.VVCでは,High tierの最大フレームレートが従来の300frame/sから960frame/sに拡張されている.
JVETでは,VVC標準化において提案された技術の性能を公正に評価する目的で共通実験条件(CTC : Common Test Condition)(1)が規定されている.CTCにはWVGA(480p)から4K(2,160p)の解像度のシーケンスが規定されており,各シーケンスに対して符号化実験を行い基準となる符号化方式に対する符号化性能改善を評価する.客観評価尺度はBjøntegaard delta bitrate(BD-Rate)(2)が用いられる.BD-Rateは基準方式によって得られる画質と同程度の画質を評価対象の方式で得るために必要な平均符号量の増減を測る指標であり,マイナス値が大きいほど基準方式に対する符号化性能が高いことを意味する.CTCにおける,HEVCに対するVVCの符号化性能を表2に示す.性能比較にはJVETから発行される最新の参照ソフトウェアHM-17.0(3)及びVTM-20.0(4)を用いた.表2から解像度が高いほどに符号化効率が向上することが伺える.前述のとおり,VVCではブロック分割における最大ブロックサイズがHEVCの64×64から128×128に拡張されており,高解像度映像の符号化において大きなブロックが選択可能となったことが符号化性能向上に寄与していると考えられる.
ARIB(電波産業会)は次世代のディジタル放送に向けた映像符号化方式の検討の中で,HD解像度及び4K解像度において放送品質を満たす所要ビットレートを報告している(5).2025年頃にハードウェアで実現可能となるようなソフトウェアエンコーダを用いて,二重刺激劣化尺度(DSIS)法,5段階劣化尺度による主観評価実験により算出されたHD及び4K解像度(共に60frame/s)における所要ビットレートを表3に示す.
(1) F. Bossen, et al., “VTM and HM common test conditions and software reference configurations for SDR 4 : 2 : 0 10bit video,” JVET-AB2010, 2022
(2) G. Bjøntegaard, et al., “Calculation of average PSNR differences between RD-curves,” VCEG-M33, 2001.
(3) HEVC Test Model.
https://vcgit.hhi.fraunhofer.de/jvet/HM
(4) VVC Test Model.
https://vcgit.hhi.fraunhofer.de/jvet/VVCSoftware_VTM
(5) 情報通信審議会,“地上デジタル放送方式高度化の中間報告 映像符号化,”情報通信技術分科会放送システム委員会(第76回)参考資料76-2-3,2022.
(2023年7月13日受付)
オープンアクセス以外の記事を読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。
電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。
電子情報通信学会 - IEICE会誌アプリをダウンロード