電子情報通信学会 - IEICE会誌 試し読みサイト
© Copyright IEICE. All rights reserved.
|
食とICT
小特集 1.
食とICTの動向:マルチメディア処理の観点から
――ユーザと管理栄養士のための新しい食事記録ツール――
Food Computing: From Multimedia Perspective; Food Recoding Tool for Users and Dietitians
abstract
近年は,食事情報のマルチメディア処理の研究発表が,マルチメディアやコンピュータビジョンの会議にて,頻出するようになった.本稿では,それらで対象とされる食事画像認識,マルチモーダル処理についての概要を述べるとともに,筆者らが長らく取り組んできた食事記録に関して論じる.現在,新しい視点に基づくツールFoodLog Athlを新たに開発・公開し,利用者への提供を進めている.そのツールは,ユーザだけでなく,管理栄養士に利用してもらうことを意図している.ユーザ,管理栄養士双方からの視点でシステムの機能を紹介する.
キーワード:フードコンピューテイング,マルチメディア,食事記録,栄養士,インタラクション
フードテックという言葉に象徴されるように,技術と食との新しい融合による食のイノベーションについて関心が高まっている.その範囲は,とても広く農業や生産から流通,調理等々を包含している.食べることに限定しても,IT技術は,様々な応用を生み出し,実サービスとして広く社会に訴求してきた.例えば,CookPadに代表されるレシピ共有サービス,Delish Kitchen等の調理の様子を手際良く伝える調理動画像サービス,食べログ等のレストラン推薦サービス,FoodLog等の食事記録サービス,あすけん等の食事記録を含むダイエットサポートサービスなどが挙げられる.更には,TABETEのようにフードロスを減らすような取組みまで行われている.
本稿では,特に人の食事画像の認識,マルチメディア処理の現況に触れるとともに,マルチメディア処理を活用した食事管理ツールについて述べ,筆者らが新しく構築したユーザと管理栄養士のコミュニケーションを支援する食事記録ツールについて紹介する.
FoodLog(1),あすけん(2)などの既存の食事管理支援ツールは,ユーザの自己管理をシステムがサポートするという形態をとっている.テキスト,画像を用いてユーザが自らの記録を振り返り自己管理に役立てたり,システムからユーザをサポートするメッセージが送出される.そのメッセージは,システム側でルールベースで作られたり,システム側の管理栄養士が作成する.一般ユーザがゼロから平均的な食事管理を始める場合には,システムからの支援は役に立つだろう.
その一方で,栄養管理を受けている人,アスリートのようにその目的に合わせた特別な配慮が必要な人の場合には,ブラックボックスのシステムではなく,栄養指導を行っている管理栄養士が関与するシステムであることが望ましい.
そのため,筆者らは,ユーザと管理栄養士の食事管理とコミュニケーションを支援するFoodLog Athlという新しいFoodLogを構築した(3).本稿では,食のマルチメディア情報処理の現状について触れるとともに,その新しいツールについて紹介したい.
食事のマルチメディア処理の課題は多様である.特に,この10年余り,一般のマルチメディア課題と同様に,ネットを介して多くのデータの収集ができるようになってから,大きく進展した.その課題は,食の視覚,嗅覚,味覚にわたる知覚の課題,食のカテゴリーや食材を予測する認識の課題,レシピなどの食関連の情報を検索する課題,食を人のニーズ,好みに応じて推薦する課題等々多岐にわたる.これら全てをFood Computingと定義して,その網羅的なレビューも出版されている(4).また,食事認識と関連の画像処理技術については,文献(5)に詳しい.食の情報処理に関して御関心の方には一読をお勧めしたい.
本稿では,これらのうち2点だけ取り上げる.一つは,基本的なタスクである食事画像認識であり,もう一方は画像だけでなく,レシピなどの情報も組み合わせたマルチモーダル処理である.
食事画像を対象とした取組みの歴史はまだ長くない.とはいうものの,深層学習前と後ではかなり異なる.深層学習以前の取組みでは,局所特徴とそれに基づく特徴記述を行い,SVMなどの機械学習を適用して,食事の分類問題を解くというアプローチが行われていた.例えば,文献(6)では,SIFTのBoF,色ヒストグラム等の複数の特徴量を用いたMultiple Kernel Learningによる50クラスの認識を行い,文献(7)では,局所領域として定義したスーパピクセルに対して決定木を求めて,101クラスの認識を行っていた.
その後,一般画像認識と同様に,エンドツーエンドで学習する深層学習が食事画像認識にも用いられるようになった.その最初の試みでは,頻出する10クラスの食事の分類問題にAlexNetが適用された(8).その後,多くの深層学習のフレームワークが提示され,食事画像認識に適用され,既存の食事認識の性能を大きく凌駕することが示されてきた(文献(9)~(12)など).
食事画像認識は,食事記録を平易化する重要な技術であるものの,現状の認識技術は,いまだに不十分な状況にある.ほとんどの場合において,100から200程度,多くて1,000程度のクローズドなデータセットが作られ,その範囲での性能評価を行っている.実際に食事記録に現れる品目数は,上記のデータセットより桁違いに大きい.しかも,閉じたデータセットを想定できず,品目数が増大する.また,食事品目名の定義には,個人依存性が強い等々の問題がある.これらの問題に対処するために,認識器の個人適応を行うパーソナライゼーションの積極的な導入も論じられている(13).
深層学習の進展により,単なる食事の分類認識問題でなく,モダリティを越えた検索に関わる課題へのアプローチも始まっている.象徴的なものとしては,所与の画像に対してレシピの集まりからその画像に適したレシピを検索する,あるいは,その逆で,レシピに対して適した画像を検索する課題などが挙げられる.
例えば,文献(14)では,レシピの特徴量と画像の特徴量が近づくように学習するフレームワークを提示し,特徴量からのモダリティを越えた検索を試みている.文献(15)では,クロスモーダル検索のテキスト特徴に対して,単語や文と画像との関連性の大きさを示すアテンションを導入している.文献(16)では,レシピと画像から特徴量を求め,その特徴量から生成する画像の真偽を判定する敵対的学習を導入し,モダリティのアラインメントを行い,検索性能の向上を図っている.更に,複雑な課題として,所与の画像に含まれる食材の推定も試みられている.文献(17)では,食材の共起のモデル化のためにマルチタスク学習とグラフを用いている.また,文献(18)では,食材を予測し,画像と食材から調理手順までの生成を試みている.
このようにFood Computingは,より広範なデータを集める処理へと進化している.
FoodLogは,写真で簡単に個人の食事記録をとることを目指して,筆者らが開発を進めてきた(19).画像を用いた食事記録ツールとしてFoodLogは,広く一般提供された最初のものであろう.筆者らは,2008年にデモし,2009年に食事バランスの推定を行い,2013年に公開したモバイルベースのアプリ以降,画像検索や画像認識により,食事記録を支援する.広く無料で公開したこともあり,一般ユーザに適度に利用され,今まで総計すれば,1,000万件を超す記録が集まっている.
FoodLogや既存の栄養指導アプリとは異なり,新しく構築したFoodLog Athl(3),(20),(21)は,運動選手などを相手に栄養指導を行う管理栄養士を支援することに重点を置いている.(なお,ユーザが運動選手である必要はない.)
聞き取り調査をしたところ,通常は図1に示すように栄養指導が行われている.選手(ユーザ)は,毎食の写真や食事記録,毎日の体重などの記録,そして必要に応じて質問やコメントなどをLINEといった一般的なコミュニケーションツールを使って管理栄養士に送る.管理栄養士は,送られてきた記録を基に何らかの栄養計算を行い,選手の目標値,バイタルデータを合わせて考慮して,選手にアドバイスを送る.このループを回すことで,選手は継続的に記録を続け,管理栄養士は,日々のデータの処理を行う.このようなやり方で,多くの場合の栄養指導が行われている.ITツールとしては,コミュニケーションツールの利用にとどまっている.栄養計算といった作業は,一つずつ行う必要があり,選手ごとのデータのアーカイブやデータの整理も別作業として行う必要があるなど,作業量は多い.
この従来の方法に対して,新しいFoodLogのフレームワークは,図2のようになり,メッセージを送受するコミュニケーションループに,食事記録システムを統合している.食事画像認識を使うことで,選手の食事内容の記録をサポートする.選手の食事記録は入力時にデータ化されているので,管理栄養士は,必要に応じた修正,追加,削減を行うだけで,栄養計算は最小限にとどめることができる.選手ごとに日々の食事内容と数値を一覧し,メッセージを送ることができる.なお,栄養データベースについても大きな違いがあり,FoodLog Athlでは,FoodLogと異なり,
(1)食事栄養データベースとして,foodLogの一般食約1,400件とEatSmartの提供する一般食,外食,外販まで含めた約14万件のデータ(22),文部科学省の日本食品標準成分表(23).(また,要望のあったプロテイン4種も加えた.)
(2)食事品目名は栄養データベース中のものに限定.
(3)ただし,管理栄養士は,記録されている栄養データの修正,食材レベルでの加減算ができる.
以下,それぞれのユーザツールと栄養士ツールについて紹介する.
ユーザ(選手等)は,自分の記録をモニタして指導する管理栄養士がいる場合には,その管理栄養士をそのIDで指定する.そのような管理栄養士がいなければ,メッセージのやり取りをせずに自分の記録としてだけ使ってもいい.
食事記録にあたっては,既存のFoodLogのAPIを利用していて,その登録手順は類似している.FoodLog Athlの開始画面は,1週間の記録の様子と当日の記録の集計である(図3(a)).全くの開始時には何も映っていないが,プラスボタンに触れることで,操作が始まる.
(1)FoodLog Athlで食事の写真を撮る,あるいは,アルバムから写真を選択する.
(2)食事画像認識により写真内の食事が検出され,バウンディングボックスとその認識結果が表示される(図3(b)).食事認識は,開始時には,一般的に頻度の高い400食程度の認識器であるが,自然と新規登録を続けるうちに,パーソナライゼーションが進み,認識可能な食事が増大していく(15).
(3)認識結果に誤りがあれば修正する.間違った食事認識が行われていれば,データベース中の正しいもので置き換える.また,漏れているものや,過剰な検出があれば,スクリーンにタッチしてバウンディングボックスを追加する.必要に応じてバウンディングボックスを補正する(図3(c)).
(4)写真に写り込んでいない食事を追加したい場合は,料理名で追加をする.
(5)食事の分量としては,標準的な1人前がデフォルトでセットされている.分量の認識の自動処理は困難であり,マニュアルで調整する(図3(d)).
(6)以上の記録を登録することで,当該の食事記録が行える.これに合わせて,自由形式でコメントを書き,管理栄養士に伝えることができる.
なお,写真なしの記録も可能であり,(1)において「写真を撮らずに食事記録を作成する」を選択することで,栄養データベース中の食事品目名をテキスト検索して登録することができる.あるいは,食事製品である場合には,バーコードを利用した登録も可能である.(バーコードはEatSmartの提供するデータを利用しており,全ての食事製品に付いているわけではない.)
現在,頻出する一般食データと外食外販データを用いている.システム側で追加すれば,カフェなどのメニューであったり,病院の食事であったりと,異なるデータベースを追加したり,切り換えて用いることも可能である.
バイタルデータとしては,体重に限定しているが,将来的には,Healthcareツールのデータを読み込むことで,それ以外のデータを補充することが可能になる.
栄養士ツールについても概略を紹介したい.管理栄養士は,基本はWebでのアクセスを行うことで,指導する運動選手のデータを一覧することができる(図4).なお,ユーザ側で,管理栄養士IDを登録することで,このリストに加えることができる.
図4のユーザリストから,詳細に見る対象を選択すると,その食事記録とメッセージの送受についての記録が表示される.上部には,そのユーザの概略と体重,身長などの情報,そして,日々の栄養価として設定した目標値が表示される.
食事記録の欄のアドバイスの作成を選ぶことで,食事記録の詳細を図5のように表示できる.一日に摂取している栄養のサマリを表示する.その中では,一食ごとの食事記録について,その食事品目名,分量,栄養価を表示するようになっている.これらの記録を確認し,管理栄養士はユーザへのメッセージを書き送る.
また,食事内容が必ずしも管理栄養士の経験に照らして正しくない場合には,その修正,加算,減算ができる.図6のように,加算,減算は,食材単位で行う.なお,今のシステムは,一度記録したものへの修正は,管理栄養士だけができる設計になっている.
更に,データのエクスポートができるようになっており,レポート作成のためなど,データを加工して利用するために食事記録のデータはCSV形式でローカルに出力できる.
これに加えて,管理栄養士が場所の制約なくユーザの情報を見て,メッセージを送ることができるように,スマホのアプリも構築した(図7).選手の一覧と,選択した選手の食事内容のサマリをスマホで見ることができ,メッセージの送受も可能である.
2019年1月から3月に,東京大学アメフト部の体力増強の期間にこのツールを使って,10名ほどの運動選手の栄養指導を管理栄養士が行うというトライアルを行った.その時点では,管理栄養士の食事記録の修正機能やモバイルアプリなど一部は実現前ではあったものの,基本的な機能はできており,そのバグ出しも含めた検証実験であった.利用した管理栄養士からは,
「食品ごとに栄養素の計算をする必要がなくなった」,
「選手とのやり取りをレポートとして保存する必要がなくなった」,
「選手との食事記録の振り返りが分かりやすく容易になった」
等のコメントが寄せられ,管理栄養士に役に立つという観点での効果が確認できた.
その後,2019年11月末から,ユーザツール,栄養士ツールとも無償で公開し,小規模ながら利用が行われている.一部の利用者からのフィードバックも参考に継続的にシステムの改善を進めている.
本稿では,食のマルチメディア処理の最近の動向について紹介するとともに,筆者らのグループで管理栄養士に役立つという視点で新たに構築した食事記録ツールについて紹介した.このツールは,ユーザとそのモニタを設定自由であり,食事調査などの目的にも利用可能である.
謝辞 FoodLog Athlの開発に尽力した唐澤弘明君,天野宗佑君はじめ山肩洋子准教授を含む研究室のFoodLog研究グループに感謝致します.本研究の一部は,JSPS 18H03254,JST CREST JPMJCR1686,本学先端スポーツ科学研究拠点の支援を受けた.
(1) FoodLog,
http://app.foodlog.jp/
(2) あすけん,
https://www.asken.jp/
(3) FoodLog Athl,
https://karszawa.github.io/monster/
(4) W. Min, S. Jiang, L. Liu, Y. Rui, and R. Jain, “A survey on food computing,” ACM Comput. Surv., vol.52, no.5, 92, pp.92: 1-92: 35, 2019.
(5) 柳井啓司,“食事画像認識の現状と今後,”人工知能誌,vol.34, no.1, pp.41-49, 2019.
(6) Y. Matsuda, H. Hoashi, and K. Yanai, “Recognition of multiple-food images by detecting candidate regions,” ICME, pp.1554-1564, 2012.
(7) L. Bossard, M. Guillaumin, and L.V. Gool, “Food-101-mining discriminative components with random forests,” European Conference on Computer Vision, pp.446-461, 2014.
(8) H. Kagaya, K. Aizawa, and M. Ogawa, “Food detection and recognition using convolutional neural network,” ACM Multimedia, pp.1085-1088, 2014.
(9) Y. Kawano and K. Yanai, “FoodCam: A real-time food recognition system on a smartphone,” Multimedia Tools Appl., vol.74, pp.5263-5287, 2015.
(10) H. Wu, M. Merler, R. Uceda-Sosa, and J.R. Smith, “Learning to make better mistakes: Semantics-aware visual food recognition,” ACM Multimedia, pp.172-176, 2016.
(11) N. Martinel, G.L. Foresti, and C. Micheloni, “Wide-slice residual networks for food recognition,” WACV, pp.567-576, 2018.
(12) Z.-Y. Ming, J. Chen, Y. Cao, C. Forde, C.-W. Ngo, and T.-S. Chua, “Food photo recognition for dietary tracking; System and experiment,” Multi Media Modelling, pp.129-141, 2018.
(13) S. Horiguchi, S. Amano, M. Ogawa, and K. Aizawa, “Personalized classifier for food image recognition,” IEEE Trans. Multimed., vol20, no.10, pp.2836-2848, 2018.
(14) A. Salvador, N. Hynes, Y. Aytar, J. Marin, F. Ofli, I. Weber, and A. Torralba, “Learning cross-modal embeddings for cooking recipes and food images,” CVPR, pp.3020-3028, 2017.
(15) J. Chen, C.-W. Ngo, F.-L. Feng, and T.-S. Chua, “Deep understanding of cooking procedure for crossmodal recipe retrieval,” ACM Multimedia, pp.1020-1028, 2018.
(16) H. Wang, D. Sahoo, C. Liu, E. Lim, and S. Hoi, “Learning cross-modal embeddings with adversarial networks for cooking recipes and food images,” CVPR, pp.11572-11581, 2019.
(17) J. Chen and C.-W. Ngo, “Deep-based ingredient recognition for cooking recipe retrieval,” ACM Multimedia, pp.32-41, 2016.
(18) A. Salvador, M. Drozdzal, X.G. Nieto, and A. Romero, “Inverse cooking: Recipe generation from food images,” CVPR, pp.10453-10462, 2019.
(19) K. Aizawa and M. Ogawa, “FoodLog: multimedia tool for healthcare applications,” IEEE Multimedia, vol.22, no.2, pp.4-9, 2015.
(20) 唐澤弘明,川原田美雪,天野宗佑,山肩洋子,相澤清晴,“アスリートの食事管理を支援するフードコンサルティングシステム,”2019信学総大,no.H-3-4, March 2019.
(21) 相澤清晴,“FoodLog:マルチメディア食事記録ツールとそのデータ処理―運動選手の栄養管理のための新しいツール開発―,”日本スポーツ栄養学会第6回大会,2019.
(22) EatSmart,
https://www.eatsmart.jp/
(23) 文部科学省食事成分データベース,
https://fooddb.mext.go.jp/
(2020年4月27日受付 2020年5月9日最終受付)
オープンアクセス以外の記事を読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。
電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。
電子情報通信学会 - IEICE会誌アプリをダウンロード