AI外観検査導入の現実：精度95%は本当に十分か

はじめに

「AI外観検査で精度95%を達成しました」——展示会やセミナーでよく聞く言葉だ。しかし製造現場に導入した経験から言えば、「精度95%」という数字は議論の出発点に過ぎない。導入後に問題になるのは、精度以外の課題の方が多い。

精度95%とは、100件中95件を正しく判定できるということだ。裏を返せば5件は誤判定する。

1日1万個を生産する製造ラインに導入した場合：

この500件の誤判定の内訳が問題だ。

誤判定には2種類ある。

誤検知（False Positive）：良品を不良と判定

見逃し（False Negative）：不良を良品と判定

この2つのコストは非対称だ。見逃しは誤検知より何倍もコストが高い場合が多い。AI外観検査の閾値設定は、誤検知と見逃しのトレードオフを意識して行う必要がある。

製品の用途によって判断は変わる。食品・医薬品・自動車部品では見逃しが致命的なため、誤検知率が多少高くてもしきい値を厳しく設定する。逆に一般消耗品では誤検知率を下げる方向に設定する。

AI外観検査の精度は、学習データの質と量で決まる。ここが実務上の最大の壁だ。

不良サンプルの不足

外観検査の対象となる「不良」は、そもそも滅多に発生しないケースが多い。良品は大量に集まるが、不良品は数十枚〜数百枚しか集められない。この不均衡データでは、AIが「全部良品」と判定するだけで高精度になるという問題が発生する。

対処法：

ラベリングの設計

誰が「良品」「不良品」を定義するかも重要だ。検査員によって判定基準が異なるケースは多く、ラベリングが不一致になるとAIも学習できない。事前に「不良の定義書」を作り、判定基準を合意してからラベリングを開始する必要がある。

製造現場は「安定していない」。以下のような変動がAIの精度を劣化させる。

これを「ドリフト」と呼ぶ。導入時は95%の精度だったモデルが、3ヶ月後に80%まで落ちているという事態は珍しくない。定期的な精度モニタリングと再学習の仕組みを設計することが、長期運用の鍵だ。

AI外観検査の導入は「全ラインに一度に展開」ではなく、まずPoCから始める。PoCを設計する際の3原則：

3ヶ月： それ以上長いと組織の関心が続かない。3ヶ月で成果が見えなければ設計を見直す。

1工程： 複数の検査項目・品種を一度に対象にしない。まず1品種・1種類の不良検査から始める。

明確な成功条件： 「精度95%以上、かつ見逃し率0.1%以下」など、数値で合否を定義する。「なんとなく良くなった」では判断できない。

AI外観検査はリリースして終わりではない。以下の運用体制を用意する。

AI外観検査の「精度95%」は、導入検討の入口だ。本当に重要なのは：

これらを事前に設計できていれば、AI外観検査は製造品質を大きく改善する強力なツールになる。精度数字だけで判断せず、運用まで見据えて導入を計画することが成功の鍵だ。