目の前にあるものがスマホかタブレットか、あるいは犬か猫か。人間ならば、この違いを一瞬で見分けられます。しかしコンピューターがその違いを見分けようとしても、従来の技術では中々難しい場面も多く、判別不可能なケースも多く見受けられました。
その状況を一変させたのがAIを用いたディープラーニング技術。ディープラーニングを用いたAIに画像判断をさせることで、画像認識の精度が大幅に向上しました。中には野菜や果物を識別させただけで産地やブランド名までわかってしまうなど、人間より高精度で画像を認識するAIも登場し始めました。
そこで今回は画像認識とは何か、そして画像認識が私たちの身の回りのサービスやビジネスなどでどのように使われているかなどを、AI画像認識についても絡めてご紹介していきます。「画像認識についてしっかり理解して、ITに明るくなりたい」という方はぜひご覧ください。
▼この記事でわかる!
- 画像認識の仕組みと手法
- 画像認識の身近な活用例
- 画像認識が今後抱える課題
画像認識とは
画像認識とは、コンピュータを用いて画像や動画データから人物や風景などの特徴を発見し、識別するための技術。画像認識技術の歴史は古く、1960年代にはすでに研究が進められていましたが、このころは一般に普及するには至っていませんでした。そして技術が進化し、安くコンピューターが手に入る時代になるにつれて、画像認識を利用したソフトなどが一般にも広がりました。
そして最近では、AIとディープラーニングを組み合わせた手法により、一気に画像認識の精度が向上しました。ディープラーニングが一気に注目を浴びるようになるきっかけを作ったのは、画像認識の技術を各チームが競う「ILSVRC(ImageNet Large Scale Visual Recognition Challenge)」の2012年度大会でした。
トロント大学のSuperVisionチームが分類部門などで他チームを大きく引き離し、約70%前半が相場だった認識率を約85%に塗り替えました。この出来事からAIとディープラーニングを用いた技術が世界中で注目されるようになりました。そして現在では95%以上と、人間の認識率さえ超える画像認識も可能になりました。
画像認識の仕組みや手法
画像認識の仕組みや手法はどうなっているのでしょうか。
まず人間は目に映るものを経験から判断し、一瞬で見分けられますが、コンピューターは画像や動画を点の集まり(「ピクセル」の集まり)としてとらえます。人間は犬や猫など、対象ごとに人物や物などを見分けられますが、コンピューターは全ての対象を点として認識しています。
このままではコンピューターが対象物を識別できないので、画像認識ではまず画像や動画を加工してコンピューターが識別してくれるようにします。具体的には、以下のような流れで動きます。
- ノイズや歪みなど、コンピューターが画像や動画を認識するときに不必要な部分を削除する
- 画像認識させたい部分(オブジェクト)の輪郭や明暗などを調整し、コンピューターが認識しやすい状態にする
- オブジェクトにどんな画像であるかの情報(ラベル)を付与する
そして加工したデータをコンピューターに複数読み込ませて、対象物がどんな特徴を持っているか判断できるように学習させていきます。この学習のことを「機械学習」と言います。従来の機械学習には、コンピューターに学習させたいデータを人間が加工する手間が掛かり、また精度向上にも限界がありました。
この状況を打破したのがディープラーニングでした。ディープラーニングでは大量のデータをまとめてAIに読み込ませることで人物や物などの特徴を学習。学習後AIが自動で対象物を判別してくれる技術です。
ディープランニングにより従来画像認識で必要だった加工が簡単になり、人間は大量の認識用データを集めることに傾注できるようになりました。さらにインターネットの普及により画像認識用データも簡単に収集できるようになり、ディープランニングによる画像認識精度は一気に向上しました。
AI画像認識技術が支える身近なサービス
AIとディープラーニングを用いて、画像認識技術は一気に進化しました。そこでここからは私たちの身近で使われている、AI画像認識技術を使ったサービスをご紹介していきます。
- 車の追突防止機能
- セキュリティ認証
- 駅内の監視カメラ
車の追突防止機能
前方の障害物や歩行中の人などを認識し、自動でブレーキをかける追突防止機能。ブレーキをかけて事故を予防するには、目の前に衝突するかもしれない障害物や人などがいることを車で事前に検知しないといけません。
そこで追突防止機能ではAI画像認識技術を用いて、車前方の状況を自動処理。前方の障害物や人などをディープランニングによる高い精度で検出し、事前の追突防止へとつなげています。
セキュリティ認証
外国旅行のときなどに、空港で顔認証ゲートを通して本人確認を求められたことはありませんか?顔認証ゲートにも、AI画像認識技術が使われています。
旅券内のICチップ内に保存されている本人の顔と、顔認証ゲートで撮影した顔を照合し、なりすましなどがないか検査します。旅券にスタンプを打つ必要がないので、スムーズな入出国手続きも可能になります。ちなみに各空港にAI画像認識技術を利用した顔認証ゲートなどの設備を提供しているのは「NEC」で、NECは世界でもトップクラスのAI画像認識技術を有しています。
駅内の監視カメラ
特に東京都など都市では帰省や通勤ラッシュで人がごった返すことも少なくない駅。駅には不審者が犯罪を起こしたり、駅内の人がホームに転落してしまい事故が発生するなど、危険がいっぱいあります。
こういった犯罪や事故などを未然に防ぐために、駅内の監視カメラにもAI画像認識技術が搭載されています。
監視カメラ内の映像をAIが画像認識することで、黄色い線状ブロックへの人の侵入や、不審者の振る舞いなどを検知できます。さらに顔認識による人物照合なども可能になります。
さらに駅内の監視カメラにAI画像認識技術を搭載すると、犯罪や事故などを未然に防げるだけでなく、監視している駅員の業務負担軽減にもつながります。
各分野における画像認識の応用例
ここからは、各分野で画像認識がどのように活用されているかご紹介していきます。
ネットサービス
コミュニティサイトなどのウェブサービスでは、昔から誹謗中傷など不適切な画像がよく流れていました。しかし不適切な画像を人の手で削除しようとすると、他のコンテンツとより分けながら探す手間がかかり、膨大な時間が掛かっていました。
画像認識技術では、ディープランニングで学習したAIが不適切な画像を自動で検出してくれます。また精度も高いので、人間よりも確実に不適切な画像を見つけ出せます。このように画像認識はインターネット上のトラブルを防ぐ目的でも活用されています。
また画像認識や音声認識を組み合わせて不適切な動画を検出するサービスも開発されており、今後不適切なメディアを機械の手でどうやってより確実に削除できるようになるのか注目です。
交通調査
新規で店舗を出店する際などに、企業はその地域でどれくらい車が動いているか、また人通りがあるかなど、集客に重要な交通量を計測します。これを交通調査と呼び、従来はアルバイトを雇ったりして人の手で交通調査するやり方が一般的でした。
最近では、画像認識を利用して交通調査をAIに任せようという取組が広がりつつあります。
ディープランニングを利用すれば、通過した車がセダンなのか、それとも軽自動車かなど、車種まで区別した認識がAIを使って可能になります。また人の目で交通調査を行うと数え忘れなどが発生するなど、やや正確性に欠けるという弱点を、AIの画像認識技術を使えばカバーできます。AIに画像認識を任せれば、人件費も削減できるなど他にもメリットがあります。
農業
人手不足などが問題視されている農業。課題を解決すべく、農業では「IoT(モノのインターネット化)」を利用したスマート農業が推進されています。
スマート農業ではドローンなどIT機器を駆使して農場の整備を行うことで、農業の業務負担軽減や品質の向上などを目指しています。スマート農業では効率のよい農薬散布などを行うために画像認識技術が使われています。
例えばドローンが農場全体をカメラ撮影。撮影画像中から害虫がいると思わしき箇所をAIが自動で検出します。そして検出された箇所だけに農薬を散布することで、農薬コストの削減や農薬残留量の低減などが可能になります。
画像認識を実現するための課題とは
画像認識はすでに各サービスや分野で活用されています。しかし画像認識にはまだ解決すべき課題がいくつかあります。
- 誤認識などをどうやって防ぐか
- 個人情報をどう扱うか
- 倫理観をどうするか
誤認識などをどうやって防ぐか
AIとディープラーニングを活用することで一気に精度が向上した画像認識技術ですが、その精度はまだ完璧ではありません。
例えばGoogleではステッカーと呼ばれる特殊な画像を作成し、AIに認識させる画像に貼り付けました。すると例えば画像に写っているものが果物や野菜でも、AIがステッカーに気を取られて上手く判別ができない事例が確認されています。また画像や動画によっては、AIが対象物を誤認して別の物と認識してしまう場合もあります。
どんなに異質な状況でもしっかり対象物を検知し、その上で検出精度をどうやって100%近くにまで向上させるかが画像認識の課題の1つとなっています。
個人情報をどう扱うか
画像認識では、大量のデータを取得します。その中には人間の顔も含まれています。
各人の顔を本人の許可なしに勝手に利用すると肖像権の侵害になり、実際に画像認識システムに関連した裁判が行われたこともあります。また情報漏洩などで顔に関する情報が外部に漏れてしまうと、漏洩した企業にも大きなダメージがあります。
画像認識で取得した顔データをどうやって適切に扱うかも、画像認識における課題となっています。
倫理観をどうするか
AIは人間のように倫理観を持ちません。ですから画像認識で判別した物に対してタブーであったり、誹謗中傷に当たるような表現をしてしまうこともあります。
自動で処理が可能なAI画像認識技術ですが、あくまでAIはコンピューターであるという点を念頭において、どうやって倫理観を持たせていくかという観点で技術開発を進めていくことも重要になってきています。