学位論文要旨



No 125120
著者(漢字) ビンセント,ペレラ マノジ
著者(英字)
著者(カナ) ビンセント,ペレラ マノジ
標題(和) 低次元表現に基づく人間のキーポーズとスタイルの解析
標題(洋) Keypose and Style Analysis Based on Low-dimensional Representation
報告番号 125120
報告番号 甲25120
学位授与日 2009.03.23
学位種別 課程博士
学位種類 博士(学際情報学)
学位記番号 博学情第19号
研究科 学際情報学府
専攻 学際情報学専攻
論文審査委員 主査: 東京大学 教授 池内,克史
 東京大学 教授 相澤,清晴
 東京大学 教授 國吉,康夫
 東京大学 教授 深代,千之
 東京大学 教授 山口,泰
内容要旨 要旨を表示する

人体動作解析は,コンピュータグラフィクスやコンピュータビジョンにおいて,複雑であるが極めて興味深く重要な研究領域である。魅力に富んだ実用的アプリケーション作成のために,動作の再構築・編集・リターゲティングに関する多くの研究がなされてきた。これらはコンピュータゲーム,映画製作,テレビ製作などにおけるアニメーションへの大きな需要を受けてのものである。リハビリのための歩行解析など生命科学や,スポーツでの技能向上を目指すバイオメカニクス,ロボット工学でのバランス制御などにおいても,キャプチャされた動作の解析の重要性は増してきている。また人体動作解析は昨今,人物識別・動作認識・人物追跡などセキュリティシステムにおいても急激に需要が増大している。人体動作解析が重要となる応用分野は広く,現在も成長を続けている。

同時に人体動作解析には,多くの克服すべき問題がある。人体動作は姿勢空間における姿勢の列によって構成されており,各姿勢は高次元空間中に大量の情報を含んでいる。例えば,動作は個人差,感情,身長,体重,見た目,動作速度など様々な要素から構成されている。それゆえ動作解析そのものが複雑な問題であり,より一層注目されるべき問題である。一方で動作の低次元化表現により,これらの問題はたいへん単純で容易に解ける問題となる。そして姿勢空間において人間の行動を幅広く理解することが可能になる。

本論文では動作解析に関する3 つの極めて重要な問題について述べる。第1 にキーポーズ抽出のアルゴリズムについて述べる。第2 に人体動作をキーポーズを用いて再構築し,人間の感性におけるキーポーズの重要性を示す。第3 に人体動作をMulti Factor Tensor を用いることにより低次元空間に分解し,動作のスタイルを高精度に認識する手法を提案する。

最初の問題については,動作エネルギー関数を導入することにより,与えられた舞踊動作からキーポーズを抽出する新しい手法を提案する。提案するエネルギー関数は,人体各部の運動量に基づいて構成される。エネルギー関数は,世界座標系と体中心座標系という2つの座標系で計算される。この方法では我々のグループでこれまでに開発したリズムトラッキングの手法を利用し,キーポーズ候補の選択と抽出に人体各部の運動量からなる動作エネルギー関数を用いる新しい動作解析手法をこれと組み合わせる。実験結果をこれまでの手法と比べることにより,従来手法では抽出できなかったキーポーズも提案手法により高い精度で抽出できていることが分かった。

第2 番目の問題については,キーポーズに基づき低次元動作を再構築する手法を提案し,人間の感性において与えられた動作空間におけるキーポーズが重要であることを示す。上述の手法により抽出されたキーポーズを利用してモデルを数式化し,それに基づきキーポーズ空間という低次元動作空間を定義する。このキーポーズ空間を利用することで,動作を低次元にマッピングしたり,その空間から動作を復元したりすることが可能となる。実験の結果,次元を3 次元まで落した動作が様々な動作解析に有効であることが示された。さらに我々は異なる手法により得られた低次元動作どうしを比較することによって,キーポーズに基づくモデルにより構築された低次元動作が人間の感性に極めて大きな効果を持つことを示した。

第3 番目の問題については,Multi Factor Tensor (MFT)モデルに基づいて,動作スタイルと人物の認識を行う新しい手法を提案する。まずこれまでに開発した音楽解析手法を用いて,キーポーズに基づきすべての舞踊動作をセグメントに分割する。動作データは,MFTモデルによりモデル化する前に,ベクトル化手法を用いて正規化しておく。続いてMFT モデルを用いて,舞踊を個々の踊り手とは独立なタスクと,個々の踊り手に依存したスタイルに分離する。動作データが与えられると,MFT モデルを構成し異なるモードに効果的に分解して,タスクとタスクを実行する人物を認識するのに用いる。実験においては,2 つのアプローチを採用した。最初の実験ではタスクとスタイルをテンソル部分空間での関数を最大化することによって認識し,次の実験ではテンソル部分空間での関数値を認識の閾値として用いた。提案手法の性能を評価するために行った様々な実験により,我々のモデルの高い精度が示された。

本論文で提案した手法は,人体動作解析において既存の研究に対して,極めて良好な結果を示した。本論文の寄与は,初心者やロボットに教示するためのサムネイルや動作の要約,データ圧縮など,様々な現実の問題に対して応用可能である。

審査要旨 要旨を表示する

本論文で提案した手法は,人体動作解析において既存の研究に対して,極めて良好な結果を示した。本論文の寄与は,初心者やロボットに教示するためのサムネイルや動作の要約,データ圧縮など,様々な現実の問題に対して応用可能である。

第1章は"Introduction"と題し,これまでの人体動作解析の研究の流れを紹介しつつ,低次元化表現による人体動作の取り扱いの必要性・重要性を述べるとともに,本論文で提案する舞踊動作を低次元化して扱う手法の特徴や寄与を概観している。

第2章は"Keypose Extraction with Energy Analysis"と題し,エネルギー関数を用いたキーポーズ抽出について述べられている。ここでは与えられた舞踊動作から動作エネルギー関数グラフを用いてキーポーズを抽出する。提案するエネルギー関数は,人体各部の運動量に基づいて,世界座標系と体中心座標系の2つの座標系で計算される。これを従来手法でも用いられているリズムトラッキング手法と組み合わせ,舞踊動作から適切なキーポーズを抽出するアルゴリズムが構成される。実験結果を従来手法と比べることにより,提案手法の高い抽出精度が確認された。

第3章は"Low-dimensional Motion Reconstruction"と題し,キーポーズに基づく低次元動作の構築手法が提案されている。まず前章の手法により抽出されたキーポーズを利用してモデルを数式化し,低次元動作を生成する手法が示されている。実験の結果,次元を3次元まで落しても見た目に自然な動作が生成可能であることが判明した。続いて単純なサンプリングに基づく低次元動作を生成して比較実験を行い,キーポーズに基づくモデルにより構築された動作が人間の感性に極めて大きな効果を持つことが示された。複数の舞踊動作に関して実験を行ない,同様の結果が得られることを確認した。

第4章は"Style Analysis by Decomposing Motion into Low-dimensional Space"と題し,Multi Factor Tensor(MFT)モデルを用いて,動作スタイルと人物の認識を行う手法が提案されている。ここで舞踊は個々の踊り手とは独立なタスクと,個々の踊り手に依存したスタイルに分離される。動作データが与えられると,MFTモデルに基づいて3つのモード(人物,タスク,マーカ位置)に分解される。この結果を利用して実験では,テンソル部分空間での関数を最大化することによって,タスクとタスクを実行する人物を認識することが可能になっている。章の後半では,提案手法の性能を評価するために様々な実験を行い,提案手法の高い精度が示されている。

第5章は"Conclusion"と題し,これまでの内容を要約するとともに本論文寄与をまとめ,さらに提案した手法が今後どのように発展・応用され得るかが示されている。

以上これを要するに,本論文では舞踊動作の低次元表現による効果的な動作認識・生成手法を提案しており,学際情報学上貢献するところが少なくない。本審査委員会は、本論文が博士(学際情報学)の学位に相当するものと判断する。

UTokyo Repositoryリンク