技術紹介

独立行政法人 産業技術総合研究所
関西産学官連携センター 知的機能連携研究体長
富田文明
(画像処理、コンピュータビジョン、知能ロボット等の研究に従事)

2次元統計的解析から3次元構造的解析へ

一般の画像処理システムが工場で使えないのと全く同じ理由で、ロボットの自律行動に2次元画像処理は使えない。我々が共存する生活分野では、工場でのように環境や対象を制限し、可能性をすべて尽くすようなことは、さらに困難なことは明白だろう。
この問題を解決する手段の一つは、2次元の視覚をやめて3次元の視覚に切り替えることだ。人間はテレビや写真といった2次元の画像からその3次元の情報を得ることができる。しかし、これは人間に高度な脳の機構と膨大な先験知識によっているために現在の技術での実現は難しい。写真の中の餅が、果たして絵に書いた餅かどうか識別は不可能であることからわかるように、理論上に解けない問題-つまり設定不良問題になっている。さらに、計測精度の面では、対象物までの正確な距離や大きさは、対象物についての事前知識がないと求めることができない。人間の眼と同じように2眼のステレオカメラを製作して、立体視をすれば解決する。環境が変化しても、3次元の形は照明条件や表面の模様や反射によらないので多くの問題が解決できる。言い換えれば、これまでの2次元画像処理が、わざわざ片目をつぶって見えにくくして、問題を難しくしてきただけとも言える。
もう一つの手段は、対象の構造を解析する手法である。画像の色や明るさといった統計量ではなく、対象物の連結性やその形状そのものを解析する方法への転換だ。例えばコップであれば、水の入る部分があって、横に取手がついていることを見つければよい。それは表面の模様や背景にはよらないし、わざわざ事例を用意して学習させる必要もない。こうすれば、コップを探したり、他のものと識別したりできる。工場での利用であれば、3次元の形がわかる設計データを教えるだけで、対象環境から識別して認識するシステムが実現できる。

>>次ページへ