ailia SDKで使用できる機械学習モデルである「AxGazeEstimation」のご紹介です。エッジ向け推論フレームワークであるailia SDKとailia MODELSに公開されている機械学習モデルを使用することで、簡単にAIの機能をアプリケーションに実装することができます。
AxGazeEstimationの概要
AxGazeEstimationはax株式会社が開発した視線を検出するための機械学習モデルです。入力した画像から視線の向きを検出することができます。
AxGazeEstimationのアーキテクチャ
AxGazeEstimationでは、BlazeFaceで顔を検出し、検出した顔の画像を入力として視線を推定します。視線の推定においては、顔の画像から直接推定する方法と、顔の画像と顔の向きから推定する方法の2種類の方法を使用可能です。
BackboneはResNet50の縮小版(stage 3)を使用しています。
学習にはax株式会社で独自に作成したデータセットを使用しています。Training setが97059枚、Validation setが11775枚です。
AxGazeEstimationの使用方法
AxGazeEstimationを使用するには下記のコマンドを使用します。WEBカメラから視線を検出することができます。
$ python3 ax_gaze_estimation.py -v 0
下記のコマンドで、顔の向きの検出を併用して推定することができます。
$ python3 ax_gaze_estimation.py -v 0 --include-head-pose
AxGazeEstimationの実行例です。
ax株式会社はAIを実用化する会社として、クロスプラットフォームでGPUを使用した高速な推論を行うことができるailia SDKを開発しています。ax株式会社ではコンサルティングからモデル作成、SDKの提供、AIを利用したアプリ・システム開発、サポートまで、 AIに関するトータルソリューションを提供していますのでお気軽にお問い合わせください。