特集 4. 【三次元ビジョン】三次元陰関数表現が切り開く三次元コンピュータビジョンの最前線──NeRFへ至る道と更にその先へ──

電子情報通信学会 - IEICE会誌 試し読みサイト
Vol.105 No.5 (2022/5) 目次へ

前の記事へ次の記事へ


特集4. 第2部 画像分野
【三次元ビジョン】
三次元陰関数表現が切り開く三次元コンピュータビジョンの最前線
──NeRFへ至る道と更にその先へ──
Advances in 3D Computer Vision with Neural Implicit Representation
池畑 諭

池畑 諭 国立情報学研究所コンテンツ科学研究系

E-mail sikehata@nii.ac.jp

Satoshi IKEHATA, Nonmember (Digital Content and Media Sciences Research Division, National Institutes of Informatics, Tokyo, 101-8430 Japan).

電子情報通信学会誌 Vol.105 No.5 pp.375-380 2022年5月

©電子情報通信学会2022

abstract

 筆者は,画像から物体形状や光学特性等の三次元情報復元を目的とする三次元コンピュータビジョンの研究に携わっている.三次元コンピュータビジョンでは,従来多視点幾何や物理的原理に関する最適化問題を解く手法が用いられてきた.しかし,近年の深層学習の普及により,データドリブンなアルゴリズムや三次元点群やメッシュ以外の三次元表現も広がりつつある.本稿では,三次元陰関数表現によって新たな地平が切り開かれたディープラーニング時代の三次元コンピュータビジョンの近年の研究動向を俯瞰する.

キーワード:三次元コンピュータビジョン,陰関数表現,NeRF

1.は じ め に

 NeRF(Neural Radiance Fields)(1)は三次元コンピュータビジョン界隈において,ここ1,2年で最も耳にするワードであると言っても過言ではない.これは,入力画像間を滑らかに補完する自由視点合成という古典的な問題に対する深層学習を利用した最先端のアプローチとして提案されたものであるが,従来手法と異なり,補完であることがほとんど知覚されないほどに高品質な合成結果を与えることが話題になった.この研究が発表されてから現在に至るまで,NeRFを基盤とする新たな問題や解法が続々と発表されている.本稿ではNeRFというキーワードに関心がある読者を対象に,いかにしてNeRFが提案されたのか,そもそもNeRFとは一体何か,それが三次元ビジョンという研究分野にどのように影響を与えたのかを解説する.

2.三次元陰関数表現

 NeRFの核となっているのが,三次元情報を三次元空間上で定義された陰関数(Implicit Function)で表現する試みである.三次元表現といえば距離画像,三次元点群,表面メッシュ,充塡ボクセルが一般的だが,これらの持つ非連続性や非規則性あるいは空間の離散化は,可微分性や記憶必要量の観点から深層学習との相性が余り良くなかった.そこで三次元情報を空間全体で定義された連続関数で表現することにより,ニューラルネットワークによる三次元情報の効率的な予測を実現したのが三次元陰関数表現である.なお,陰関数表現が三次元処理に利用されたこと自体は別段新しいことではない.SDF(Signed Distance Field;符号付距離関数)のように物体表面をゼロとする陰関数で表現することはCGの分野では一般的に行われてきた.


続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。


続きを読む(PDF)   バックナンバーを購入する    入会登録

  

電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。

電子情報通信学会誌 会誌アプリのお知らせ

電子情報通信学会 - IEICE会誌アプリをダウンロード

  Google Play で手に入れよう

本サイトでは会誌記事の一部を試し読み用として提供しています。