特集 深層学習は情報・システムの研究をどう変えたか
第4部 融合分野
10.【画像・音声生成】画像生成における深層学習の展開と音声変換への応用
Advancement and Application of Deep Generative Models in Image Synthesis and Voice Conversion
金子卓弘
深層学習により,自然な画像・音声が容易に生成・変換可能に
画像や音声などのメディア情報は人と人,人と機械のコミュニケーションにおいて必要不可欠なものであるが,イメージどおりのものが簡単に得られないことがある.その解決手段として,近年,深層生成モデルを用いた生成・変換技術が注目を集めている.本稿では,まず,深層生成モデルのれい明期から主要な研究対象である画像生成を題材に,深層生成モデルの変遷について解説する.次に,深層生成モデルの特徴である幅広い応用可能性を示す一例として,音声変換への応用について紹介する.最後に,深層生成モデルの今後について展望する.