電子情報通信学会 - IEICE会誌 試し読みサイト
© Copyright IEICE. All rights reserved.
|
筆者は,画像から物体形状や光学特性等の三次元情報復元を目的とする三次元コンピュータビジョンの研究に携わっている.三次元コンピュータビジョンでは,従来多視点幾何や物理的原理に関する最適化問題を解く手法が用いられてきた.しかし,近年の深層学習の普及により,データドリブンなアルゴリズムや三次元点群やメッシュ以外の三次元表現も広がりつつある.本稿では,三次元陰関数表現によって新たな地平が切り開かれたディープラーニング時代の三次元コンピュータビジョンの近年の研究動向を俯瞰する.
キーワード:三次元コンピュータビジョン,陰関数表現,NeRF
NeRF(Neural Radiance Fields)(1)は三次元コンピュータビジョン界隈において,ここ1,2年で最も耳にするワードであると言っても過言ではない.これは,入力画像間を滑らかに補完する自由視点合成という古典的な問題に対する深層学習を利用した最先端のアプローチとして提案されたものであるが,従来手法と異なり,補完であることがほとんど知覚されないほどに高品質な合成結果を与えることが話題になった.この研究が発表されてから現在に至るまで,NeRFを基盤とする新たな問題や解法が続々と発表されている.本稿ではNeRFというキーワードに関心がある読者を対象に,いかにしてNeRFが提案されたのか,そもそもNeRFとは一体何か,それが三次元ビジョンという研究分野にどのように影響を与えたのかを解説する.
NeRFの核となっているのが,三次元情報を三次元空間上で定義された陰関数(Implicit Function)で表現する試みである.三次元表現といえば距離画像,三次元点群,表面メッシュ,充塡ボクセルが一般的だが,これらの持つ非連続性や非規則性あるいは空間の離散化は,可微分性や記憶必要量の観点から深層学習との相性が余り良くなかった.そこで三次元情報を空間全体で定義された連続関数で表現することにより,ニューラルネットワークによる三次元情報の効率的な予測を実現したのが三次元陰関数表現である.なお,陰関数表現が三次元処理に利用されたこと自体は別段新しいことではない.SDF(Signed Distance Field;符号付距離関数)のように物体表面をゼロとする陰関数で表現することはCGの分野では一般的に行われてきた.
続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。
電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。
電子情報通信学会 - IEICE会誌アプリをダウンロード