画像認識とは?AIを駆使した画像認識の仕組みや事例を徹底解説!

column

画像認識とは?AIを駆使した画像認識の仕組みや事例を徹底解説!

Text : なまっちゃ / Editor : 吹原紗矢佳

犬を見たときに、多くの人は、猫ではなく「犬」と瞬時に判断できる。では、りんごを見たときに、品種を一瞬で判別することはできるだろうか。

経験を積んだ農家の人ならできるかもしれない。しかし、多くの人々は判断できないだろう。品種を見極めるための色や形の差は、経験がなければわからないほどにわずかだからだ。

そんな判別を、一瞬で、しかもほぼ正確にできてしまうのがAI(人工知能)を用いた画像認識である。

本記事では、そのような画像認識の仕組みを解説し、どのような場面で使用されているかの事例を紹介する。

画像認識とは?

画像認識(Image recognition)とは、画像や動画から顔や文字などのある特徴を認識し検出する、パターン認識技術の一つである。

冒頭で述べたように、人は写真に何が写っているかを視覚情報から瞬時に判断し、認識できる。しかしコンピューターは、自動で判断も認識もできない。その実現を可能にしたのが、「画像認識」という技術である。

画像認識の歴史は長く、1960年頃には人工衛星の画像解析として研究が行われていた。当時はコンピューターの性能が低くコストがかかるため、限られた研究機関だけが画像認識の技術を扱っていた。

また、画像認識率は、高くても70%台前半であった。しかし近年、AI(人工知能)の導入によって機械学習におけるディープラーニング(深層学習)が進化したことにより、正解率は95%以上と、人間の認識能力に近づいている。

画像認識の仕組み

画像認識をするためには、前準備として2つの作業が必要となる。まず、画像から認識対象のオブジェクトを抽出しなければならない。そのために、画像の歪みやノイズを取り除き、オブジェクトの輪郭を強調することによって領域を抽出する。

次に、抽出した画像に対して、ラベル(その画像が何であるか)を付与することで、正解データを生成する。上の画像でいうと、オレンジ枠で囲った部分が顔であるというラベルを付与する。

そして、この正解データをもとに機械学習を行うことで、学習の成果である「モデル」を作り上げる。学習を重ねることで、コンピューターに未知の画像データを与えると、その画像に何が映っているのかを推測できるようになるのだ。

画像認識ができるライブラリ

画像認識ができるライブラリ(※)として、以下が挙げられる。
※ライブラリ…ある特定の機能を持った関数や機能、プログラムを部品化し、他のプログラムが引用できる状態にしたものを、複数集めて一つのファイルに収納したもの

・OpenCV
・TensorFlow
・Caffe
・Google Cloud Vision API
・Chainer
・Visual Recognition
・Watson Visual Recognition

OpenCVは、画像処理・画像認識ができる代表的なライブラリとして挙げられる。

画像認識だけでなく、ノイズの除去やAR・VRに対応していたりと、幅広い画像を扱える。

その他のライブラリも画像認識を行えるが、それぞれ得意分野が変わってくる。用途に応じたライブラリを使うのも肝心だ。

画像認識AIを用いたアプリの事例紹介

画像認識を使って、実際にどのようなことができるのか。事例を紹介するとともに、画像認識の活用の方法を探っていく。

TensorFlowを活用した画像認識AIで、クリーニングの無人店舗を目指す

福岡県田川市にあるクリーニング店「クリーニングハウスレモン」(株式会社エルアンドエー)では、Googleがオープンソースとして公開している機械学習用のソフトウェアライブラリ「TensorFlow」を用いて、レジの自動受付システムを開発した。

同市では少子高齢化が進み、労働者の人手不足に陥っている。そこで、クリーニング店を営む田原大輔さんは、人手不足でも店舗を回せる状態にするため、受付作業をAIに代替した。

このクリーニング店の受付システムでは、顧客が洋服を受付に置くと、まずカメラでその洋服が撮影され、画像として取り込まれる。その後、事前に登録しておいた25,000枚の洋服の画像データをもとに、自動的に種類を判別する。このシステムにより、お客さんがセルフで受付できるようになった。

同様に、自動受付システムを導入した結果、従業員が本来注力すべき仕事に時間を充てられ、生産性が高くなることが期待できる。AIの画像認識が、地方の大きな問題である人手不足を解消する一手となるかもしれない。

TensorFlowで野菜のランク付けを自動化。農業×ディープラーニングの可能性

画像認識の技術は、農業にも使われている。例えば、サラダや漬物で親しまれるキュウリ。これらは、出荷時に傷や病気があるものを除き、形や色合い、大きさによってランク別に選別しなければいけない。

とある農家では、収穫ピーク時には1日約500キロ(約4,000本)ものキュウリを手動でランク分けするため、膨大な時間を必要とする。人手を増やすにも、この作業は確認するポイントが非常に多く、見分けるための経験が必要だ。そもそも後継者が見つからないことなども問題になっている。

静岡県でキュウリ栽培農家を営む小池誠さんは、この問題を解決するために、先述したGoogleが公開しているソフトウェアライブラリ「TensorFlow」を使い、キュウリの等級選別の自動化を行った。約7,000枚のキュウリの画像に対して等級をラベル付けし、1,500枚の画像でテストを行ったところ、判別の正解率が90%以上にまで向上した。

しかし、品種や季節、栽培方法によって作物の形状が変わるため、さらに膨大なデータ量が必要となる。また、各要素が変わったときの差を調整する仕組みも必要で、まだまだ課題は多い。

タイヤの画像認識アプリを、顧客との接点にするオートバックス

オートバックスセブンは、2017年9月26日に、スマートフォンで撮影した画像からAIを使ってタイヤの磨耗状態を簡単に確認できるサービス「かんたん タイヤ画像診断」を、自社内の特設サイト(https://tc.autobacs.com)に開設した。

「かんたん タイヤ画像診断」は、日本IBM社の提供するAI「IBM WatsonTM」の持つ画像認識機能(IBM Watson Visual Recognition)を使用している。IBM Watson TMは、自然言語処理と機械学習を使用し、画像や言語、音声などの非構造化データから認識し判別するテクノロジープラットフォームだ。人間には読みきれないような大量のデータの中からすばやく知見や洞察を見出せる。

ユーザーがアップロードしたタイヤ画像と、あらかじめ登録されているタイヤの画像を抽出し、摩耗状態を判別する。診断結果は、磨耗度合いに応じて「大・中・小」の3段階で表示される。

これにより、時間や場所を選ばずにタイヤの磨耗状態を簡単にチェックでき、ユーザーのカーメンテナンスへの意識を向上させる。それと同時に、店舗を超えたオートバックスと顧客との接点を構築できる。

画像認識AIで現代の問題を解決へ導く

画像認識は、大量の学習データを用意する必要があり、野菜の形状など状態が変化しやすいものに関しては正解率が低いこともあるため、まだまだ課題点は多い。

しかし、AIの進化により、精度はこの先もさらに上がっていくことが期待できる。さまざまな場面で画像認識を活用した事例ができることで、人間だけでは解決しえなかった現代の問題が進展することだろう。