*

”CognitiveServices Face API” VS ”Amazon AI Rekognition” 画像認識五番勝負!!

   

はじめに

この記事は「Microsoft Cognitive Services & Bot Framework – Qiita」の17日目です。

2つのサービス発表を現地で見て湧き上がる思い。

さて、実はわたくし、今年は会社のご厚意もあり、2回海外のカンファレンスに行くことができました。
そして、そこでCoginitiveサービスの発表を生で見ることができました。

1回目は、3月末にサンフランシスコで行われた、Microsoft技術カンファレンスである、Build2016。Microsoft Coginitive Servicesが発表されました。
2回目は、12月初めにラスベガスで行われた、AWSの世界最大のカンファレンス、re:Invent2016。Amazon AIが発表されました。
「AI」というバズワードが世間に広がる中、クラウド界の両雄が、よりAIを手軽に使うためのCoginitiveサービスの発表をしたのです。
この発表の場に両方立ち会った私は思いました。

「見せてもらおうか!CoginitiveServicesとAmazon AIのそれぞれの性能とやらを!(訳:比較しよう!)」

ただ、比較するにしても互いのサービスを見ると中々機能が同じものがありません。
そこで、今回は顔認識機能のFaceAPIと、Amazon Rekognitionについて比較したいと思います。

Amazon AI?何それ、美味しいの?

さて比較する前に、AWSのサービスがわからない。ご先祖様からAWSは使うなと言われているという方もいるかもしれませんので、Amazon AIについて軽く説明を。
Amazon AIとは、AWSが提供するAIのAPIで、3種類のAPIが提供されています。
・イメージ認識を行うAmazon Rekognition。
・文章をリアルな音声に変換するAmazon Polly。
・AmazonAlexaのエンジンを使用した会話型インターフェースAmazon Lex。
今は米国の2か所と、EUの1か所、計3リージョンでGAしています。

https://aws.amazon.com/jp/amazon-ai/

では、始めよう!画像認識五番勝負!!

今回、FaceAPIについてはMicrosoftが公式で出しているサンプルプロジェクトを使用します。
https://github.com/microsoft/cognitive-Face-Windows

Amazon Rekognitionについては、AWSコンソール上から利用できるデモサイトを利用します。

 

一番!顔認識(一人)勝負!

まずは手始め。1人写真の顔認識について比較します。
写真はぱくたそさんの写真を使いました。

・FaceAPI

当たり前ですが、きちんと認識できています。この写真では、女性、20歳、笑顔、眼鏡なしと出ています。

・Amazon Rekognition

こちらもきちんと認識ができています。Rekoginitionでは、各要素に対してどれだけの指数が出ているかで判断しています。この写真では、appears to be female(女性と思われる)が100%の指数が出ています。

結果 – 引き分け!

どちらも認識ができているので、この勝負は引き分けです。

 

二番!顔認識(複数)勝負!

今度は複数人が写っている写真の顔認識について比較します。
人数が多い方が良いので、この勝負ではAKB48の56人が写っている写真を使います。
http://japanchord.com/wp-content/uploads/2014/07/AKB48.jpg

・FaceAPI

56人中なんと51人の顔を認識しています。これはすごい。

※写真にはモザイクをかけています。

 

・Amazon Rekognition

こちらは残念、15人しか認識が出来ていません。

※写真にはモザイクをかけています。

 

結果 – FaceAPI!

複数人の写真ではFaceAPIの方が一歩上手でした。顔の面積が狭い写真でもFaceAPIはきちんと顔の特徴を捉えているようです。

 

三番!顔認識(アニメ顔)勝負!

今度は三次元ではなく、二次元の顔を認識するかを見てみましょう。
この勝負ではより奇抜なアニメ顔を認識するかを試すため、仮面といえばこの人、赤い彗星シャアの写真を使いたいと思います。ジークジオン!
https://i.ytimg.com/vi/K0d_mZQdfpw/hqdefault.jpg

・FaceAPI

な、なんと!ノーフェイス!ノーフェイスです!FaceAPIはアニメ絵については、顔認識の学習はしていないのかもしれません。

※写真にはモザイクをかけています。

 

・Amazon Rekognition

こちらはきちんとシャア大佐の顔を認識しています。これはすごい。
ただ、eyes are closed(目が閉じている)に99.9%の指数がつけられているので、もしかしたら白目向いているよねと判定している可能性があります。それはそれで面白いですが。

※写真にはモザイクをかけています。

 

結果 – Amazon Rekognition!

今回はAmazon Rekognitionが勝利です。一応、複数の顔が写っているアニメ絵(アイドルマスターの画像を使いました。)も試してみましたが、FaceAPIは顔検出ができませんでした。

 

四番!顔判定(両方とも同じ人)勝負!

今度は同じ顔かを判断する顔判定についてみていきます。
この勝負の写真もぱくたそさんの写真を使いました。
どちらも本人で、服装・髪型を変えただけの場合と、さらにコスプレをした場合とで見てみます。

・FaceAPI

服装髪型だけは、70%、コスプレでも60%です。これは似ていると言えるかなと思います。

・Amazon Rekognition

こちらは服装髪型だけは、90%を超える高い数字。ただし、コスプレについては完全に他人と判定されています。

結果 – FaceAPI?

服装髪型の変更についていえば、Rekoginitionの方が精度が高く出ているかなと思います。ただ、コスプレ写真については日本で使う場合は必要かなということで。今回はFaceAPIが一応の勝利ということにしておきます。

 

五番!顔判定(そっくりさん)勝負!

今度は別人だけどそっくりさんの人との顔判定についてみていきます。
この勝負での写真はドラマ相棒に出演されている六角精児さんの写真と、「六角精児 似てる」でヒットしたカンニング竹山さんの写真を比べてみたいと思います。

・FaceAPI

50%の確率で間違いということで、違う人物であることを示しています。

※写真にはモザイクをかけています。

 

・Amazon Rekognition

こちらは77%似ているということで、抽出する際に判断に迷う値となっています。

※写真にはモザイクをかけています。

 

結果 – FaceAPI!

今回もFaceAPIが勝利というところでしょうか。どうもAmazon Rekognitionについては、日本人顔の精度はまだまだなのかもしれません。

 

最終結果発表!

ということで、最終結果は、FaceAPIが3、Amazon Rekognitionが1、引き分け1で、今回はFaceAPIの勝利となりました!

 

最後に

今回の結果はあくまで2016年12月17日現在での評価となります。日々AIは進化をしていますので、しばらくしたらまた結果が変わっているとおもいます。
また、それぞれのサービスには顔認識以外にもいろいろな機能があります。FaceAPIでは顔分類ができますし、Amazon Rekognitionでは、顔だけでなく写真のオブジェクトの抽出もできたります。
お互いに特徴があるサービスで面白いので、今後もいろいろと触ってみたいと思います。

 - AWS, Azure ,