形も動きも一定ではない「人」という物体を、いかに高い精度で認識するか。

自動運転技術において、物体の検出・認識は重要な要素技術のひとつ。そこにどんな技術的課題があるのか、2020年開設の博多ラボで物体検知アルゴリズムの開発に携わるエンジニアに話を聞きました。

技術・開発

エンジニアインタビュー

DS部I.T

2015年にアイシン（旧：アイシン精機）に転職する前は、愛知県で組み込みソフトの開発に携わっていた。博多ラボの印象について「現在はリモートワークが多いが、交通の便がよく働きやすい。周辺に店舗も多く、食べ物も美味しく住みやすい」と語る。

ご担当の「物体検知アルゴリズム」とは一体どのようなものですか？

I.T : カメラを用いて、人や車両などの物体を検出・認識するアルゴリズムです。さまざまな用途への活用が期待されている要素技術ですね。

さまざまなセンサーがある中でカメラを使うのは何故ですか？

I.T : 情報量の多さです。人やクルマなど多種多様なものを検出できるようにしたいのですが、例えばソナーでは情報量が少なく、色や詳細な形状までは認識できません。

ディープラーニングというと、自ら学習を進めていくというあれですね？

I.T : いえ、私たちが採用しているのはそういった強化学習ではなく、私たちが教師となるデータを準備して進めていく学習方法です。

それはまたなぜですか？

I.T : ときにAIは思いもよらない間違いを起こします。目の前に人がいるのに何故か認識しなかったり、逆に何もないところに人を検出したり・・・。

も、もしかして幽霊・・・？

I.T : 幽霊かどうかはわかりませんが（笑）、もやのようなものを人と認識してしまっている可能性もありますよね。そうした間違いが起きないように、学習の方向性を調整できる現在の方法を使っています。

特に「人」はいろんな体格の方がいますから、検出が難しそうです。

I.T : そうですね。身長など体格の差だけなら良いのですが、問題は動作や姿勢のバリエーションが尋常ではないという点です。

というと？

I.T : 立つ、屈む、歩く、走るなど、姿勢や動きによって人の形状は大きく変わりますよね？そうするとカメラで認識すべきパターンが何乗にも膨れ上がりますから、とにかく膨大な画像データのインプットが必要になってきます。

なるほど。他にも判別が難しいケースってありますか？

I.T : あとは、背景と前景の差異が少ないケースでしょうか。

白い服を着た人が白い壁の前に立つような？

I.T : そういうのもあります。他にも夜間や雨天時など、光量が少ない時はやはり物体の検出が難しくなります。ですので、検出対象が埋もれた画像データを人工的に作成して学習させるなどの対応を行うわけですが・・・。

AIが苦手な画像を集中して、学ばせるのですね？

I.T : そうすると、今度は「過学習」の問題が、出てきます。「オーバーフィッティング」とも呼ばれる、AI開発者がよく直面する問題のひとつです。特定のデータばかりを学習させ続けると、全体の正解率が下がってしまう現象を指します。

何故そのようなことが？

I.T : 先ほどのように、例えば夜間のデータに特化させて学習を続けると、明るい朝や昼間の画像データで物体を検出しなくなるといった現象が発生するんです。簡単にいうとアルゴリズムの偏りですね。

学習のバランスが大事ということですか。

I.T : はい。繰り返しになりますが、そういった調整の難しさが、今回のAIを実用化するために乗り越える壁になっています。

あっちも学び、こっちも学びだと、ものすごい量のデータが必要ですよね？

I.T : その通りです。

その膨大なデータの収集はどのように行っているのですか？

I.T : ひたすら大量に撮影する！これに尽きますね。撮影部隊の方が専用の車両に乗り込み、欲しいシーンがありそうな場所を撮影してもらっています。そして彼らが持ち帰ったデータを私たちが処理する、という流れで開発を進めています。

気が遠くなる作業ですね・・・。

I.T : そうなんですよ。人力での対処には限界があるので、並行して不足データを補完できるようなソフトウェア開発にも取り組んでいます。また、自社に高性能GPUサーバがあるので、開発環境にも助けられていますね。

ちなみに、どのような言語やライブラリを使っていますか？

I.T : 言語はPythonです。フレームワークにはTensorflow、PyTorchと、上位ラッパーライブラリのKerasを使っています。

I.Tさんはキャリア入社とのことですが、転職の動機を教えていただけますか？

I.T : 前職ではカーナビ用のソフト開発を行っていましたが「もっと幅広い仕事をやってみたい」と考え、転職活動をはじめました。アイシンを選んだのは、当時関心をもっていた画像認識技術の開発に携われると聞いたからです。

転職してみていかがですか？

I.T : 今は担当する仕事の幅が広がった一方で、考えなければいけないことが多くなって大変です（笑）。でも、やりたかった画像認識を任されていますし、やりがいも感じています。思い通りの転職ができて満足していますよ。

今後取り組んでいきたい開発テーマや活動はありますか？

I.T : 社内に車室内をセンシングするAI技術を開発するチームがあるのですが、用途こそ異なるものの、コアとなるAIの仕組みはよく似ているんです。現在は個別に開発していますが、今後はコア部分となるAIをまず育て、それを横断的にさまざまなシステムにポンポン展開できるような枠組みを構築できたら、と考えています。