AIセキュリティツールが公開前に流出——Anthropicの誤算

AnthropicのサイバーセキュリティAI「Mythos」が、公開当日に不正アクセスされたと報告。第三者ベンダー経由の流出が示す、AI管理体制の盲点とは。

「悪意ある者の手に渡れば、強力なハッキングツールになりかねない」——Anthropic自身がそう警告していたAIが、公開初日に見知らぬグループの手に渡っていた。

何が起きたのか

2026年4月、AIスタートアップAnthropicが企業向けサイバーセキュリティツール「Claude Mythos」を発表しました。このツールは、企業のセキュリティ強化を目的として設計されたAI製品です。しかし同社は当初から、悪用されれば逆に企業のセキュリティを脅かす「諸刃の剣」になり得ると認識していました。

そのリスクを抑えるため、AnthropicはMythosを「Project Glasswing」と呼ばれる限定公開プログラムの枠内で、Appleをはじめとする一部の信頼できるベンダーにのみ提供しました。広く公開するのではなく、管理された環境での運用を選んだのです。

ところがBloombergの報道によると、ある非公開のオンラインフォーラムのメンバーたちが、公開発表と同じ日にMythosへの不正アクセスに成功していたとされます。彼らはAnthropicと契約している第三者ベンダーに勤める人物のアクセス権限を足がかりにしたとみられており、さらに「Anthropicが他のモデルで使用してきたURLのフォーマットに関する知識」をもとに、モデルのオンライン上の場所を推測したと報じられています。

Anthropicの広報担当者はTechCrunchに対し、「第三者ベンダー環境を通じたClaude Mythos Previewへの不正アクセスの報告を調査中」と述べました。現時点では、Anthropic自身のシステムへの影響は確認されていないとのことです。

なぜ今、これが重要なのか

広告掲載について

[email protected]

このグループはDiscordチャンネルを通じてつながっており、未公開のAIモデルに関する情報を収集することを目的としているとされます。報道によれば、彼らの動機は「新しいモデルで遊ぶこと」であり、「混乱を引き起こすことではない」と情報提供者は述べています。スクリーンショットやライブデモという形で証拠も提示されており、単なる噂ではないことが示唆されています。

しかし、動機の良し悪しにかかわらず、今回の出来事が示す構造的な問題は深刻です。最も厳格に管理されるべきAIツールが、第三者ベンダーという「側道」から流出したという事実は、AIの安全管理における根本的な課題を浮き彫りにしています。

AIの能力が高度化するにつれ、その「配布経路」の管理は開発そのものと同じくらい重要になっています。どれほど優れたセキュリティポリシーを持っていても、サプライチェーンの末端に脆弱性があれば、すべてが無効になりかねません。これはAnthropicだけの問題ではなく、AIを企業に提供するすべての企業が直面する課題です。

関係者それぞれの視点

企業ユーザーの立場から見れば、今回の件は不安材料です。Appleのような大企業がProject Glasswingに参加しているということは、Mythosが実際のビジネス環境に統合されることを想定しています。そのツールが管理外の第三者に使われているとすれば、競合他社や悪意ある攻撃者に自社のセキュリティ設計のヒントを与えることにもなりかねません。

規制当局の視点では、このケースはAIの「限定公開」という手法の限界を示しています。EUのAI法（AI Act）をはじめ、各国でAI規制の枠組みが整備されつつある中、「信頼できるベンダーへの限定提供」が実効的な安全策として機能するかどうかが問われています。日本でも経済産業省がAIガバナンスのガイドラインを策定していますが、第三者ベンダーを含めたサプライチェーン全体の管理については、まだ十分な議論がなされていません。

日本企業にとっての文脈も見逃せません。ソニー、トヨタ、NTTなどの大企業は、海外のAIベンダーのツールを積極的に導入し始めています。こうした企業が類似のツールを利用する際、第三者ベンダー経由のリスクは他人事ではありません。日本のサプライチェーンは多層的で複雑であり、責任の所在が曖昧になりやすい構造を持っています。

一方で、今回のグループが「悪意を持っていなかった」という点は、別の問いを生みます。彼らが善意の研究者だったとしても、同じ手法を悪意ある者が使えば結果は全く異なります。セキュリティの穴は、最初に見つけた人の動機に関係なく、穴であり続けるのです。