LiLzと東北大学の研究グループ、世界初となる量子アニーリングを活用したデータセット浄化技術を開発

〜ラベルノイズを効率的に除去し、AIの汎化性能を飛躍的に改善〜

LiLz株式会社のプレスリリース

〜ラベルノイズを効率的に除去し、AIの汎化性能を飛躍的に改善〜

LiLz株式会社(沖縄県宜野湾市、以下、リルズ)の大塚誠と東北大学大学院情報科学研究科大関真之教授らの研究グループは、機械学習において問題となる「間違ったラベルの付いたデータ」を取り除く新技術を開発しました。この成果は、データクレンジングという重要課題に量子技術を応用した世界初の実証例であり、今後は大規模実データや産業・医療分野での展開が期待されます。本研究成果は、2025年10月29日に科学誌 Scientific Reports に掲載されました。

【背景】

これまでのAI開発において、モデルの汎化性能に悪影響を与える「間違ったラベルのついたデータ」は主に人手で取り除く必要がありました。近年のAI開発で用いられるデータ数は大規模化する傾向があり、このようなデータの修正作業には膨大な工数と時間を要していました。

【開発の成果】

研究グループは、ブラックボックス最適化と量子アニーリングを統合し、ノイズフリーな検証データセットに対する検証誤差を直接最適化する枠組みを提案しました。従来の手法では困難とされてきた組合せ的に膨大なデータ部分集合の探索を量子アニーリングにより効率的に実行することで、良質な解を高速に得られることが確認されました。数値実験タスクを用いて性能を検証した結果、本手法は誤ラベルによる悪影響が大きなデータを優先的に除去することが示されました。さらに、D-Wave Quantum社の量子アニーラーを用いた場合、古典的なシミュレータと比較してウォールタイム(実際の経過時間)で約10倍〜100倍の高速化を実現しました。

【今後の展開】

  • 本研究で提案された手法は、今後、以下のような展開が期待されます。

  • 産業・医療分野における大規模実データの品質向上

  • ラベルなしデータセットの品質向上

  • 特徴量選択と組み合わせた学習データと特徴量の同時最適化

今後もリルズは、「機械学習とIoTの技術融合で、現場の仕事をラクにする」というミッションを実現すべく、学術機関との共同研究などを通じて、様々な産業の現場課題を解決していきます。

【YouTube解説動画】

日本語版:https://youtu.be/YI9J9BVDY0o

英語版:https://youtu.be/acWqba1lleg

【発表のポイント】

  • AI開発における大きな課題である「間違ったラベルのついたデータ」を効率的に取り除く新手法を開発しました。

  • ブラックボックス最適化と量子アニーリングを組み合わせ、従来困難だった「検証誤差の直接最適化」を実現しました。

  • 実験では、D-Wave Quantum社の量子アニーラーを利用し、古典的なシミュレーターと比べてウォールタイム(実際の経過時間)で10倍から100倍の高速化が確認されました。

  • 本研究結果は、大規模な実データを扱う医療・産業分野への応用が期待されます。

図1.提案手法の概念図。ラベルノイズのある大量の学習用データセットから徐々にラベルノイズを取り除くために、まずは正しくラベルづけされた少量の検証用データセットを用意します。学習用データセットのサブセットで訓練されたAIモデルの性能を検証誤差で評価すると、学習用データの選び方に対してエネルギーに似た値を紐付けることができます。複数の異なる「データの選び方」に対して、それぞれ「検証誤差」を紐づけ、その関係性を二次近似することで、「検証誤差」が低くなりそうな「データの選び方」をサンプラーで提案できます。また、サンプラーによって提案された「データの選び方」を評価しては、評価値の近似精度を上げるということを逐次的に繰り返すことで、より良い学習サブセットを探すことができます。この処理を「ブラックボックス最適化」と呼び、サンプラーとして「量子アニーラー」を用いることで、シミュレーターを用いたときよりも、ラベルノイズがより綺麗に取り除かれた学習データセットをより速く見つけ出すことができます。

【論文情報】

タイトル:Filtering out mislabeled training instances using black-box

optimization and quantum annealing

著者:Makoto Otsuka*, Kento Kodama, Keisuke Morita, Masayuki Ohzeki

*責任著者:LiLz 株式会社(研究員)・東北大学大学院情報科学研究科(客員研究員)・ 大塚誠

掲載誌:Scientific Reports

DOI:10.1038/s41598-025-21686-z

【東北大学大学院情報科学研究科】

教授:大関真之

URL:https://altema.is.tohoku.ac.jp/~mohzeki/

東北大学 プレスリリース

URL:https://www.tohoku.ac.jp/japanese/2025/10/press20251031-02-quantum.html

東北大学 公式X

URL:https://x.com/tohoku_univ/status/1984130629127360661

【LiLz株式会社】

所在地:沖縄県宜野湾市我如古2-3-7 2F

設 立:2017年

代 表:大西敬吾

URL:

(公式HP)https://lilz.jp/

(チーム紹介note)https://note.com/lilz/

事業内容:AIおよびIoT技術を活用したサービス提供、研究開発 等

Follow
SHARE
このページのURLとタイトルをコピー
お使いの端末ではこの機能に対応していません。
下のテキストボックスからコピーしてください。