pepperは、どういうふうに、ひとを認識しているのだろう。これ、あくまでも、推測ネ。
まず、ことばの理解。これは、こちらが、しゃべったことばを、いったんテキストに変えているんだとおもう。そうすれば、あとはデータベースから、それに関連したことばを引っぱってくれば、いいじゃない。
顔の認識について。こちらはパターン認識じゃないかなぁ。こちらの顔と、あちらに保存されている画像データを重ねて、より重なるもの、あるいは、より重ならない部分が小さいものを選ぶようにすれば、いいわけで。
そのほかのこと、非構造化のデータは、どうなってるのかは、わかんないなぁ。