特集 5. 【映像符号化】映像符号化・配信における深層学習の広がり

電子情報通信学会 - IEICE会誌 試し読みサイト
Vol.105 No.5 (2022/5) 目次へ

前の記事へ次の記事へ


特集5. 第2部 画像分野
【映像符号化】
映像符号化・配信における深層学習の広がり
Deep Learning for Image Compression and Video Delivery
甲藤二郎

甲藤二郎 正員:フェロー 早稲田大学理工学術院基幹理工学部情報通信学科

E-mail katto@waseda.jp

Jiro KATTO, Fellow (Faculty of Science and Engineering, Waseda University, Tokyo, 169-8555 Japan).

電子情報通信学会誌 Vol.105 No.5 pp.381-386 2022年5月

©電子情報通信学会2022

abstract

 筆者は1980年代後半から画像符号化と映像配信の研究開発に従事し,国際標準化の現場にも携わってきた.2010年代半ば以降の深層学習の発展は,画像符号化や映像配信の研究分野にも少なからぬ影響を与えている.例えば2018年から,学習ベースの画像符号化を議論する国際ワークショップCLIC(Challenge on Learned Image Compression)が毎年開催されており,また,国際標準化でも深層学習の符号化応用に関する活動が開始されている.本稿では,深層学習が画像符号化・映像配信分野に与えた影響や今後の展望について紹介を行う.

キーワード:画像符号化,生成モデル,画質評価,映像配信

1.ま え が き

 画像符号化の国際標準化は1988年に開始され,静止画像圧縮としてのJPEG(Joint Photographic Experts Group)や動画像圧縮としてのMPEG(Moving Picture Experts Group)が,我々の日常生活に欠かせないものになっている.また,テレビ会議や映像配信の国際標準化も同時期に開始され,昨年来のコロナ禍では,テレワークやオンライン授業の必須ツールとして,一気に一般社会に普及するに至っている.

 一方,深層学習の研究開発が加速する中で,2016年頃から深層学習の画像符号化応用の研究開発が開始され,2018年からは,コンペティションスタイルの国際ワークショップCLICが開始されている(1).その圧縮性能は年々更新しており,現時点の静止画像圧縮としての性能は,最新の国際標準方式に匹敵若しくは凌ぐ性能を実現している.図1には,静止画像圧縮の国際標準方式と深層学習による画像符号化の圧縮率の変遷を示す.ここで縦軸はJPEGを100%とする圧縮率を示している.

図1 静止画像符号化の国際標準と学習型画像符号化

 また,深層学習の通信応用に関する研究開発も加速しており,原画像を必要とするFR(Full Reference)型・原画像を必要としないNR(No Reference)型それぞれの画質評価尺度応用や,映像配信における適応レート制御応用などに関する報告が多数行われている.

 本稿では,これらの研究開発動向を紹介するとともに(2)(7),今後の展望や,筆者らによる研究開発例についても紹介を行う.

2.深層学習の画像符号化応用

2.1 部分適用方式とエンドエンド方式


続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。


続きを読む(PDF)   バックナンバーを購入する    入会登録

  

電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。

電子情報通信学会誌 会誌アプリのお知らせ

電子情報通信学会 - IEICE会誌アプリをダウンロード

  Google Play で手に入れよう

本サイトでは会誌記事の一部を試し読み用として提供しています。