良品学習AIの導入、待って!注意点をどこよりも深く解説
この記事でわかること
良品学習の導入を検討されている方、ちょっとお待ちください! 良品学習とは何か?AIとは何が違うのか?検索するとたくさんの記事が出てきますが、だいたい同じような内容を目にすると思います。そして、様々なAIの製品が同じに見えることでしょう。ここでは、特に「これから外観検査のAIを導入する方」だけでなく「AIで精度がでなくて困っている方」にも向けて、選定時に気を付けるべきことを、業界の実情を踏まえて一歩踏み込んで解説します。
良品学習AIとは
AIとはそもそも何か
AI(人工知能)というと、技術的にはディープラーニングを指すことがほとんどです。ディープラーニングとは人間の神経回路を模擬した構造を持ち、今ではChatGPTをはじめとする言語処理や、自動運転の画像認識技術に欠かせないものとして生活に浸透しています。外観検査などは特に画像認識のディープラーニングが使われています。
画像処理系のディープラーニング技術の例として、猫や犬など一般的なものを認識できるAIがあります。数多くの画像の中から「猫」であれば「猫に共通する特徴」、犬であれば犬のそれをデータから発見していきます。この過程を「学習」と言います。
人間でも猫をなぜ猫と言えるか。その定義を教えてくださいと言われたら、中々答えにくいと思いますが、人間には何となくできてしまいます。 例えば、あなたが画像から猫と犬の区別ができるアルゴリズムを書いてくださいと言われたら、答えられるでしょうか。私自身も想像がつきません。 人間が判断ができるのは、複雑な神経回路がネットワーク上に張り巡らされ、複雑な処理を経て瞬時に判断できるためです。この神経回路を模して造られた技術がディープラーニングなのです。
(詳細は今回の記事では割愛しますが)ディープラーニング技術は人間の神経回路を模した構造であり、データ(入力)と答えてほしいこと(出力)のセットを学習させることで複雑な処理プロセス(つまり入力と出力の複雑な関係性)をデータから獲得することができるのです。
外観検査におけるAIの種類
外観検査ベンダーなどが頻繁に触れるAIの種類について説明します。
・教師あり学習:不良品学習とも言われます。不良データをAIに教えます。与えた不良をしっかり学習させれば高精度になることや、不良種まで出力させることができる魅力があります。しかし、不良が多くない現場では、学習のためのデータ集めの負担が大きいことに加えて、新しい不良に対応できないということに強く留意する必要があります。
・教師なし学習:良品学習や異常検知、アノマリー検出と呼ぶ場合もあります。良品を学習し、そうではないものを検出するというアプローチです。AIが良品として持つイメージとの差分検知とも言えます。不良を教えることを「教師あり」というのに対し、不良を教えないので「教師なし」と言います。良品は日常的に集まることを考えると魅力的なアプローチであり、教師あり学習に見られる不良収集の負担や、未知の不良への対応ができることから、教師なし学習(良品学習)積極的に探すユーザーも見られます。
学習方式 | 定義 | 長所 | 短所 |
---|---|---|---|
教師あり学習 (不良品学習) |
不良データをAIに教えるアプローチ | 十分にデータが集まれば高精度な分類が可能 | 不良データ収集が大変。学習していない不良モードは未検出になり得る |
教師なし学習 (良品学習) |
良品を学習し、良品とは異なるものを検出するアプローチ | 良品は大量にあるので学習しやすく、検査を立ち上げやすい | 不良の分類はできない。(一般には)過検出が多い |
画像処理とAIは何が違うのか?
一見、良品学習AIは不良品学習AIに比べて魅力的な側面があるように見えます。 では、従来からある画像処理とAIは何が違うのでしょうか?今回は良品学習のアプローチに近い画像処理の手法に着目してみていきましょう。
差分検知(画像処理)
画像処理にお詳しい方ならば、類似する画像処理として差分検知が思いつくのではないでしょうか。
マスター画像を登録しておいて、検査対象の画像と、登録しておいた画像との差分を見るという手法です。 一般的に、登録画像の位置に極力合わせるための位置補正をしてから、対象画像と登録画像の差分を見ます。 差分画像における白い部分が差分として取得された部分を表し、通常、この部位を異常として扱います。
差分検知(画像処理)の欠点
上記の画像について、本来の不良はチップの破損不良でした。この部位以外のかなりの部分が異常として扱われています。つまり過検出です。
なぜこのようなことが起きるかというと、製品には必ずばらつきがあるからです。
下図は当該製品の良品を並べた図になります。一見わかりにくいですが、製品には例えば以下のようなばらつきがあります。
登録画像との差分では、常に生じるばらつきが必ず異常の候補としてとらえられます。ソフトウェアによっては、エッジで過検出しやすいのでエッジでの検出を抑える処理が可能なものもありますが、本質的な対処とは言いにくいかもしれません。
画像処理の場合、対象の製品のばらつきがとても小さい必要があるということに留意する必要があります。
良品学習AIは何ができるのか
では良品学習AIはこの問題に対する対策になるのでしょうか。結論から言うと、通常の良品学習の場合、答えは半分YESです。
ここから話が若干難しくなりますが、特に今良品学習AIを使っていて課題に当たっている方や比較検討をされている方は詳細までお読みいただければ幸いです。
まず、「良品との比較」で人間にできて、画像処理にできないことは何でしょうか。その模式図を示します。人間は生産される製品を続けて眺めるときに、良品の範囲、すなわち分布を何となく把握し、「これはレアだ、なにか違いを感じる」ということができます。しかし、画像処理のマスタ画像との差分検知では、どんなに事前に観測したデータと比較しても、今検査したい対象が厳密に一致することはありません。実は良品学習AIが目指していることは、人間が把握するようなばらつきの分布を学習し、そこから離れたものを異常とみなすことなのです。これは、下図「AIがNGとする領域」です。この領域が理想的な良否判断を模式的に表しています。しかし、マスタ画像との比較(差分検知)では同じ画像は1つとして存在しないので、あくまで、「登録画像との差」だとすると、必ず異常でない部位を異常とみなしてしまいます。これが過検出の原因です。
通常の良品学習AIが陥る問題
実は分布をうまく学習できるかに差がある
上記のことがAIが得意とするならば非常に魅力的に見えます。しかし、実は多くの良品学習を使った製品が抱えている問題があります。
実は良品が持つばらつきは、決して単純ではなく、画像の中に、先述のばらつきが組み合わさって生じるため、事実上無限の組み合わせのばらつきが生じます。詳細には踏み込みませんが、一般的なアプローチですと、原理的に実際に生じ得るばらつきの分布を学習することができないことが多く、現実問題として、「良品学習は数万枚集めないと」「過検出が多くて使えない」というデメリットの声をよく聞きます。AIでありながら、結局登録した画像にかなり近くないと過検出になってしまうのです。
これは、例えるならば、我々が「日本人であれば初見の人でも日本人と分かる=日本人の分布を理解している」のに対し、「実際に出会った日本人の顔にかなり近くないと日本人と分からない」という状態に陥っているのです。これは良品学習自体が悪いのではなくアルゴリズムが悪いことがあるため注意深く検討いただく必要があります。これは、そもそもAIを謡いながらディープラーニングではない手法を使っている場合や、アルゴリズムに問題があるケースがあります。実は世の中の製品の中身のAIは輸入ソフトの流用が多く、一様に同じような結果しか得られないことが多いです。この点は選定において非常に重要な観点ですが、ここでは詳細は割愛させていただきます。
ヒートマップ自体にも使いやすさに差がある
ヒートマップで不良位置を提示する方法はいくつかあり、気を付けてほしいポイントです。実は多くの製品が既存製品の流用の場合が多く、違うように見えて同じAIを使っており、2の形式が多いのが現状です。
・1.分類:画像を入力し、その画像が異常か否かのみを出力します。研究分野ではありますが、製品でこのパターンはあまり見ません。
・2.半セグメンテーション:領域を図示するものの、厳密にその領域をピクセルレベルで指定するのではなく、ぼんやりと位置を同定する方式です。
・3.セグメンテーション:最も領域を厳密に出力する方式です。この方式は不良の大きさや形状による判定がしやすく最も有用な形式です。
当社では画像の1/1000、大きさにして2,3ピクセルの微細欠陥を検出のするよう極限まで精度を高めており、この方法以外は採用できません(お勧めできません)
当社AIが解決するもの
高いばらつき認識力
これまでの話をまとめると、過検出を抑えるためには生じ得るばらつきを効率的に把握する能力が良品学習AIに最も求められている能力です。
当社製品について
当社では、国産AIを担う会社として黎明期からAIに携わってきた開発力・アルゴリズム力を活かした製品づくりをしています。 特に、良品学習AIは、学習時のばらつきシミュレーション技術により、上述の問題を克服しています。 その効果として以下のような非常にユニークな特長があり、様々な製品との比較で最終的にお選び頂いております。ぜひお気軽にご相談等お問い合わせください。