AIが特定の知識を「忘れる」新技術が登場 – 誤認識を防ぎ、より安全なAI活用へ
AIの「忘れる」能力で、もっと賢く安全に
AI(人工知能)は、たくさんの情報を学習することで、様々なことを認識できるようになりました。しかし、その「何でも知っている」という能力が、時には困ったことにつながる場合があります。たとえば、車の自動運転システムが、道路脇のポスターに描かれた車の絵を本物の車と間違えてしまうようなケースです。
東京理科大学 工学部 情報工学科の入江 豪 准教授らの共同研究グループは、このようなAIの誤認識を防ぎ、もっと安全で信頼できるAIを作るための新しい技術を開発しました。この技術は、AIが学習した知識の中から、特定の種類の情報だけを「忘れる」ことができるという、世界初の画期的なものです。

新技術「近似ドメインアンラーニング(ADU)」とは
今回開発されたのは「近似ドメインアンラーニング(Approximate Domain Unlearning: ADU)」という技術です。これは、大規模視覚言語モデル(VLM)という、画像と文章を同時に理解できるAIに対して、特定の「ドメイン」(データの種類や表現形式)に属する情報だけを認識できないように「忘却」させるものです。たとえば、「実写」の車は認識し続けるけれど、「絵画」や「クリップアート」、「スケッチ」で描かれた車は認識しないように、AIを調整することができます。
これまでの「忘却」技術は、特定のデータそのものや、特定のカテゴリ(例:「人」や「自動車」全体)を対象としていました。しかし、ADUは「実写」や「絵画」といった表現形式の違いを区別して忘却できるため、より細かくAIの知識をコントロールできるようになります。

なぜ「忘れる」技術が必要なのか
VLMは、たくさんの画像と言葉を学習しているため、非常に高い能力を持っています。しかし、この「万能さ」が、かえって問題になることがあります。例えば、交通監視システムや自動運転システムでは、実際の「人」や「自動車」を正確に認識することが重要です。もし、街頭ディスプレイに表示された「人」のイラストや広告の「自動車」の絵を、本物と区別なく認識してしまうと、間違った判断につながり、重大な事故の原因になるリスクもあります。このような、不要な知識がもたらす誤認識を防ぐために、AIに「忘却」させる技術が求められていました。
新技術のポイント
VLMは非常に賢いため、異なるドメインの情報がAIの内部で複雑に混じり合っており、特定のドメインだけを忘却させることは簡単ではありませんでした。そこで研究グループは、以下の2つの新しい仕組みを導入しました。
- Domain Disentangling Loss (DDL):AIの内部で、異なるドメインの情報をはっきりと区別できるようにする仕組みです。これにより、AIは「実写」と「絵画」の違いを明確に認識できるようになります。
- Instance-wise Prompt Generator (InstaPG):画像ごとに異なるドメインの特性(例えば、同じ絵画でも写実的なものと抽象的なものがあるなど)に柔軟に対応できるようにする仕組みです。
これらの技術を組み合わせることで、AIは特定のドメインの知識だけを効率的に忘却できるようになりました。

研究成果と今後の展望
この新しい技術を4種類の画像認識テストデータで評価したところ、従来の技術と比べて平均で約1.6倍、特に難しい条件下では約1.7倍も性能が向上することが確認されました。これは、AIが不要な知識を抑えつつ、必要な知識をしっかり保つことができる新しい方法を示しています。
この成果は、AIモデルの安全性を高め、利用目的に合わせてAIをより効率的に使えるようになることにつながると期待されています。AIが「ちょうどよい」知識だけを持つことで、より安全で使いやすく、信頼性の高いAIモデルの実現に貢献するでしょう。
国際会議での発表
この研究成果は、2025年11月30日から12月7日にかけて、アメリカ・サンディエゴとメキシコ・メキシコシティで開催される、機械学習分野の国際会議『Neural Information Processing Systems (NeurIPS 2025)』にて、Spotlight論文として発表されます。
用語解説
-
視覚言語モデル (Vision-Language Model: VLM):画像の情報と文章の情報を同時に理解し、処理できるAIモデルのことです。
-
クラスとドメイン:
-
クラスは、AIが認識する対象のカテゴリー(例:犬、猫、自動車など)を指し、「何を認識するか」を表します。
-
ドメインは、データの出所や表現のスタイル(例:実写、絵画、スケッチなど)を指し、「どのような形式や表現で存在するか」を表します。同じ「自動車」というクラスでも、実写の自動車とスケッチの自動車は異なるドメインに属します。
-
-
t-SNE法:たくさんの情報(高次元データ)を、人間が見やすい2次元や3次元にまとめて表示する(可視化する)方法です。
関連情報
- 東京理科大学WEBページ: https://www.tus.ac.jp/today/archive/20251202_8376.html


