K.Tさんが開発中の「路面性状推定」は、どのような技術ですか?

K.T : 確かに、あまり聞きなれない言葉ですよね。“補修が必要かどうか、道路の状態について判断を下す”という意味合いで、私たちが普段使っている道路を安全な状態に保つ「道路維持管理支援サービス」を実現するための技術ですね。

道路の安全ですか。もう少し具体的にお願いします。

K.T : 例えば、何らかの要因によって大きな穴が空いてしまった路面を想定しましょう。放置しておくと危ないですよね。今後普及が予測されている「コネクティッドカー※」に搭載された各種センサが、そこを通過するたびに発生する振動や衝撃を検知します。そのデータをクラウド上に集積して、補修が必要な箇所を見つけ出すという技術ですね。

※自動運転など次世代モビリティ社会の実現に欠かせない、常時ネット接続でIoT化させた自動車のこと

かなり、先進的な取り組みですね。

K.T : 現状では地域住民の方から頂く通報や道路管理事業者の方々が日々実施されているパトロールで見つけて対処がなされていますが、どうしてもカバーしきれない箇所や見つけるまでに時間がかかる箇所が少なからずあります。危険な箇所を一刻も早く見つけ出し修繕することで、より安全なモビリティ社会をつくることがこのプロジェクトの最終目標です。

なるほど。AIはどのように活用されているのでしょうか?

K.T : 数十万台という自動車が常時ネット接続されるようになると、もたらされる走行データの量は膨大なものになります。その中から異常な路面の箇所を検出するために、機械学習やディープラーニングを活用しています。

しかし、一体どうやって異常個所を見つけるのですか?

K.T : 車載センサの値から、路面の異常を示す特徴を検出するアルゴリズムによって発見します。ある地点を通過した際のデータ、つまり時系列データを扱うため、RNN(Recurrent Neural Network)やLSTM(Long Short Term Memory)などのモデルを活用しているのですが、これがなかなか難しいんです。

画像のようなデータとは違うのでしょうか。

K.T : 違います。例えば、画像認識であればピクセル間の関係性、明るさの差などの特徴をスコア化して「これは人間の顔」と判別しています。しかし時系列データですと、あるセンサが取得した時刻のデータとその前後のデータとの関係性などの特徴は同じように考えられるのですが、別のセンサとの関連性といった情報は見えにくいんです。こっちのセンサの数値は0〜1で、あっちのセンサの数値は0〜100でといったケースがよくあるので、簡単には比べられません。こういった状況で、私たちがビッグデータの中から「この波形が出たら異常」というルールを形にするのは非常に困難です。

そこでディープラーニングの出番ですね。

K.T : はい。時系列データの問題だけでなく、路面の欠け方や穴の大きさなど、異常個所の形状は千差万別です。そのようなバリエーションが多いこともあり、私たちが膨大な走行データを一つ一つ解析してモデルを作り上げるのはほぼ不可能です。とにかくデータをたくさん集めて、あらゆるバリエーションを学習させていくしかない。その過程で最もバランスよく検出できるパラメータを探し、検出性能を高めていくというやり方をとっています。

データ量も大きいのでは?

K.T : そこも悩みどころです。最近の自動車はコンピュータの塊といっていいくらいで、搭載されているセンサの数も凄いことになっています。必要なデータをクラウドに上げるといっても、データの転送量や蓄積できる量には限りがありますしね。

開発にはどのようなフレームワークやツールを使っていますか?

K.T : TensorFlow、PyTorchの2大フレームワークと、scikit-learnあたりを使っています。

素人の私が聞く限りでも難しそうな開発ですが、面白そうでもありますね。

K.T : そうですね。「生きたデータ」を扱えることはやっぱり面白いですね。そこに大きな魅力を感じて転職を決めたくらいですから。

というと?

K.T : AIの学習用につくったデータではなく、実際の走行車両のリアルなデータを元に仮説を立て、統計的に分析することで「ああ、こういうことが起きているんだ」って現象や課題を発見していく。それはまさにデータサイエンティストにとっての喜びですから。

ここはAIに携わる技術者にとっていい環境だと言えますか。

K.T : そう言えると思います。自動車業界は今後も知能化のニーズは高まる一方で、チャレンジングな仕事ができますしね。車載AIの技術を持つ技術者は、この先重宝されるのではないでしょうか。自分の力を試すには絶好の環境だと思います。