東芝、学習データが十分にない産業分野でも高精度な解析を可能にする「画像解析AI」を開発
株式会社東芝は17日、「画像解析AI」において、事前学習に必要な学習データが十分に得られない顕微鏡画像や赤外線画像、生体画像といった特殊な装置や環境下で撮影した産業用途の画像(非自然画像)でも、少数の実画像データから学習データを自動生成し、迅速かつ高精度に解析できる画像解析AIを開発したと発表した。同AIは、独自の事前学習方式を特長とし、従来画像解析AIの活用が難しかった産業分野での適用が可能になり、解析の自動化による効率化・省人化に貢献するとしている。 【画像】技術における事前学習用画像の生成手順 AI開発においては、少量の画像データしか用意できない場合には、解析したい画像と特性の近い画像からなる大規模なデータセットを用いて、画像の特徴をAIに事前に学習させることで解析精度を向上させる「事前学習」が有効となる。事前学習においては、動植物や乗り物といった被写体を一般的なカメラで撮影した画像(自然画像)からなる、大規模自然画像データセットを用いて事前学習する方法が一般的だが、製造現場や医療現場などで専用の装置で撮影された産業画像(非自然画像)は自然画像とは画像の特徴が異なるため十分な精度が得られないという課題があった。 そこで東芝は、事前学習に必要な学習データが十分に得られない産業用途の画像でも、独自の事前学習技術を用いて、少数の実画像データから学習データを自動生成し、迅速かつ高精度に解析できる画像解析AIを開発した。 考案した事前学習技術は、一般的なカメラで撮影した自然画像ではなく、専用の装置で撮影された産業用途の非自然画像(対象画像)を事前学習用のデータとして用いる。対象画像の一部を切り出した画像を複数組み合わせ、その各画像をランダムに回転・反転させ1枚の画像として結合したものから、再度部分的に画像を切り出すことで、似たような特徴を持つ画像を生成する。こうして生成した画像を学習データとして事前学習させることで、自然画像を用いる場合とは異なり、解析対象の画像と類似の画像を用いた学習を実現し、画像解析AIの精度が向上する。 一般的に、AIの学習には、学習データの収集とデータ作成に時間とコストがかかるという課題があるが、開発した技術は少量の画像データのみで迅速に高精度な画像解析を実現する。開発技術によって事前学習用の大量のデータは自動生成され、その事前学習は数時間程度で処理可能なため、さまざまな産業の現場で解析の自動化による効率化・省人化に貢献するとともに、製品開発における解析の必要性の有無を判断し、短期間で開発にフィードバックしたいといったニーズにも対応する。 東芝は開発したAIの精度について、公開されている5種類の非自然画像データセット(赤外線画像、顕微鏡画像、ウェハ画像、病理画像、眼底画像)で評価した。それぞれのデータセットにおいて、ランダムに選択した40~1000枚の少量の画像データを用いて、9000~3万枚の事前学習用画像を生成し、画像識別タスク評価を行った。評価の結果、開発技術を用いて事前学習することで、代表的な大規模自然画像データセットの1つであるImageNet(学習データは130万枚)を用いて事前学習した場合を、上回る精度で画像を識別できたという。 開発したAIを用いることで、学習データとなる実画像が少なく、AIの導入を諦めていたさまざまな現場で、画像解析AIを活用できるようになると説明。少数の画像で自動検査ラインを立ち上げたい工場や、少数の生体画像で病気の有無を判別したい医師・医用機器メーカー、少数の顕微鏡画像で自動識別機能を実現したい医薬品・化粧品メーカーなど、さまざまな産業分野の発展に寄与できるとしている。 東芝は今後、東芝デジタルソリューションズ株式会社と連携し、実証を進めるとともに、さらなる精度向上を進め、早期の実用化を目指すとしている。
クラウド Watch,三柳 英樹