1. トップ
  2. 新着ニュース
  3. 経済
  4. プレスリリース

【東芝】学習データが十分にない産業分野においても、少数の実画像による「事前学習」で、迅速かつ高精度に解析する「画像解析AI」を開発

Digital PR Platform / 2024年12月17日 10時14分


[画像1]https://digitalpr.jp/simg/1398/101135/600_145_202412171004176760ce1179a2d.png


図1:自然画像と非自然画像の例

本技術の特徴
 そこで当社は、事前学習に必要な学習データが十分に得られない産業用途の画像でも、独自の「事前学習」技術を用いて、少数の実画像データから学習データを自動生成し、迅速かつ高精度に解析できる画像解析AIを開発しました。考案した「事前学習」技術は、一般的なカメラで撮影した自然画像ではなく、専用の装置で撮影された産業用途の非自然画像(対象画像)を事前学習用のデータとして用います。対象画像の一部を切り出した画像を複数組み合わせ、その各画像をランダムに回転・反転させ1枚の画像として結合したものから、再度部分的に画像を切り出すことで、似たような特徴を持つ画像を生成します(図2、図3)。こうして生成した画像を学習データとして事前学習させることで、自然画像を用いる場合とは異なり、解析対象の画像と類似の画像を用いた学習を実現し、画像解析AIの精度が向上します。一般的に、AIの学習には、学習データの収集とデータ作成に時間とコストがかかるという課題がありますが、本技術は少量の画像データのみで迅速に高精度な画像解析を実現します。開発技術によって事前学習用の大量のデータは自動生成され、その事前学習は数時間程度(*2)で処理可能なため、さまざまな産業の現場で解析の自動化による効率化・省人化に貢献するとともに、製品開発における解析の必要性の有無を判断し短期間で開発にフィードバックしたいといったニーズにも対応します。


[画像2]https://digitalpr.jp/simg/1398/101135/600_341_202412171004206760ce14d2d37.png


図2:従来技術と開発技術の比較


[画像3]https://digitalpr.jp/simg/1398/101135/600_245_202412171004246760ce189673a.png

図3:本技術における事前学習用画像の生成手順

 
 当社は本AIの精度について、公開されている5種類の非自然画像データセット(赤外線画像、顕微鏡画像、ウェハ画像、病理画像、眼底画像)で評価しました。それぞれのデータセットにおいて、ランダムに選択した40~1,000枚の少量の画像データを用いて9,000~30,000枚の事前学習用画像を生成し、画像識別タスク評価を行いました。評価の結果、本技術を用いて事前学習することで、代表的な大規模自然画像データセットの1つであるImageNet(学習データは130万枚)を用いて事前学習した場合を上回る精度で画像を識別することに成功しました(図4)。

この記事に関連するニュース

トピックスRSS

ランキング

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください