Claudeが1か月で1万件超の重大バグを発見、修正が追いつかない

未公開のAnthropicモデルが、わずか1か月で、約50の提携組織のコードベース全体に対して、深刻度「高」または「重大」とされるソフトウェア脆弱性を1万件以上発見した。社内ではClaude Mythos Previewと呼ばれているこのモデルは、現代のインターネットを支える主要なオープンソース・ライブラリ、ブラウザ、インフラに向けられた。結果として、ソフトウェアセキュリティを長らく支配してきた等式が反転する。バグを見つけることはもう仕事の難所ではない。難所は、それを修正することだ。

計画名はProject Glasswing。Anthropicは最初の数字の公表よりおよそ1か月前に同計画を立ち上げた。約50の提携組織が、自社の本番コードを同モデルにスキャンさせることに同意している。Cloudflareはそれを重要システムに解き放ち、約2,000件の指摘を受け取った。うち400件が深刻度「高」または「重大」に分類された。MozillaはこれをFirefoxに当て、次期メジャー版に向けて271件の個別の欠陥を引き出している。これは同じチームが公開モデルのClaude Opus 4.6を使って前バージョンで得た成果の10倍以上にあたる。

この数字が何を意味するかは、自分が実際に使っているソフトウェア次第だ。同モデルは、暗号ライブラリwolfSSLに証明書偽造の欠陥を見つけた。wolfSSLは、世界の家庭用ルータ、スマートホームのハブ、産業用コントローラなど、数十億台規模の機器に組み込まれている。この脆弱性にはCVE識別子CVE-2026-5194が付与され、パッチは配布中だ。同じ走査を1,000以上のオープンソース・プロジェクトに広げると、深刻度「高」または「重大」のインシデントが推定で6,202件発生した。これはおもちゃのベンチマーク上での学術的な発見ではない。あなたの暗号化通信、ブラウザのタブ、ケーブルの向こう側の機械を実際に動かしている本物のコードに潜むバグだ。

Mythos Previewは、誰でも購入できるClaudeのバージョンではない。Anthropicはこれを一般公開しない選択をしている。同社は、これだけの規模で脆弱性を見つけられる同一モデルが、悪意ある手に渡れば、産業規模でエクスプロイトを量産する装置になると主張する。発表は「いかなる企業も、こうしたモデルの悪用を防ぐのに十分強固な安全策をまだ開発していない」と述べる。当面、Mythos Previewは、検証済みの提携先と協調的な情報開示のパイプラインを備えた管理プログラムの内部でのみ稼働している。

どのような種類のバグを見つけているのか。C言語およびC++ライブラリにおけるメモリ安全性の欠陥、wolfSSLで見つかったような証明書処理の不備、ネットワークプロトコル実装のロジックエラー、広範に展開されているサービスの認証回避といった、数十年にわたって現実の情報漏えいを引き起こしてきた領域だ。英国AIセキュリティ研究所（UK AI Security Institute）の報告によれば、Mythos Previewは、攻撃の一連の流れを模した管理環境であるエンドツーエンドのcyber rangeシミュレーション2本を同時に解いた、同研究所が試験した初のモデルだという。独立系セキュリティ企業XBOWは同モデルを過去の取り組みからの「重要な飛躍」と評価し、「まったく前例のない精度」と表現した。

自動スキャナを扱った経験のある人にとって次の問いは、これらの指摘のうちどれだけが本物かである。独立系のセキュリティ各社は、深刻度「高」または「重大」と評価された報告のうち1,752件を再検証した。結果、約90.6パーセント、すなわち1,587件が正当な脆弱性として確認された。これはファジングやパターン照合ツールの典型的なノイズ水準と比べてはるかにきれいな信号だ。Cloudflareは、自社の検証における同モデルの誤検知率が、人間によるレッドチームよりも低かったと報告している。とはいえ、依然として警告のおよそ10件に1件は誤報ということになる。この規模で考えれば、山の中におよそ1,000件の「バグではない」報告書が混じり、それぞれを人間が読んで却下しなければならない。

より難しい問題は、本物のバグが報告されたあとに起きる。今回の最初の更新時点で、メンテナに通知された深刻度「高」または「重大」の脆弱性530件のうち、修正済みは75件にとどまっていた。平均的な修正に要する時間は約2週間。手いっぱいだという一部のオープンソースのメンテナは、Anthropicに対し情報開示のペースを落とすよう依頼している。同社は「ソフトウェアセキュリティの進歩は、これまで新しい脆弱性を見つける速度に縛られていた。いまは、AIが見つけた大量の脆弱性を検証し、開示し、修正する速度に縛られている」と書く。

一般のユーザにとって、現実的な結論は華やかなものではない。あなたが今日使っているソフトウェアは、いまこのページを開いているブラウザ自身かもしれないが、AIがすでに把握していて人間がまだ直しきれていない深刻なバグをほぼ確実に抱えている。協調的開示は、パッチが一般公表よりも先に届くことを前提とする。その順序は、パッチが実際に間に合って届くときにだけ成立する。Project Glasswingは現在のところ米国と英国を拠点に据えている。名前が出ている参加者はCloudflare、Mozilla、英国AIセキュリティ研究所、XBOWだ。協調的開示の同等のプログラムは、それ以外のほとんどの国には存在しない。日本、韓国、ブラジル、インドのソフトウェア・スタックで同モデルが見つけたバグが、同じ緊急度で扱われるかどうかは未解決の問いだ。

Anthropicは、Project Glasswingが提携先を増やしていると述べている。Mythos Preview自体は引き続き市場に出ておらず、同社は一般公開の時期を示していない。同社の現時点の見方では、より広い展開には、まだ存在しない安全策が必要になる。第二回の更新は2026年後半に予定されている。注視すべき指標は、AIがいくつのバグを見つけられるかではない。向こう側の人間が、そのうちのいくつを修正する時間を確保できたか、である。

タグ: Anthropic, tech-en1, Claude, AI security, Cloudflare, Mozilla