Mythos級のAIモデル「Fable 5」が一般公開へ AnthropicがClaude Fable 5とClaude Mythos 5を同日発表

2026年6月9日(米国時間)、Anthropicは同社史上最も高性能なAIモデルを一般公開するという重大な発表を行った。「Claude Fable 5」がその主役であり、これまで一部の政府機関や安全保障関連組織にのみ提供されてきた「Mythos」クラスの能力を初めて一般ユーザーが利用できるようにするものだ。同日、完全なMythosの能力を持ちながら安全ガードを外した「Claude Mythos 5」も発表されたが、こちらは引き続き審査済みパートナーへの限定提供にとどまる。一つの基盤モデルを二つの製品として分割提供するという、これまでのAI業界では例のない出荷形態が今回の最大の特徴だ。

「Mythos」とは何か 背景となるProject Glasswing

今回の発表を正確に理解するには、Anthropicが「Mythosクラス」と呼ぶモデル群の成り立ちを押さえる必要がある。

AnthropicはMythosを「サイバーセキュリティ分野において世界最強の能力を持つ」と表現している。その強力さゆえ、同社は当初このモデルを一般公開できないと判断した。サイバーセキュリティや生物・化学兵器の設計に悪用された場合、深刻な被害をもたらしうると同社が評価したためだ。こうした理由から、Mythos Previewは「Project Glasswing」と呼ばれるプログラムを通じて、米国政府との連携のもと、サイバー防衛の専門家や重要インフラ事業者などごく限られた組織にのみ提供されてきた経緯がある。

Claude Fable 5は、この強力な基盤モデルに安全フィルターを組み込むことで、一般ユーザーへの提供を可能にした製品と位置づけられる。Anthropicは発表の中で「Fable 5の能力は、これまで一般提供してきたいかなるモデルをも超えている」と明言した。

一つのモデル、二つの製品として出荷

技術的な観点からすると、Claude Fable 5とClaude Mythos 5は同一の基盤モデルを共有している。両者の違いはモデルそのものではなく、安全フィルターの有無にある。

Claude Fable 5(APIモデルID: claude-fable-5)は、サイバーセキュリティ、生物・化学、モデルの蒸留(distillation)に関連するクエリに対して安全クラシファイアが作動し、そうした問い合わせをClaude Opus 4.8に自動転送する仕組みを持つ。フィルターが発動するセッションは平均で全体の5%未満であり、通常のビジネス用途やコーディング、分析、調査などの用途ではほぼ影響を受けない設計となっている。一方のClaude Mythos 5は、一部の領域でこの制限を外した状態のモデルであり、サイバー防衛組織や重要インフラ事業者を対象としたProject Glasswingを通じて提供される。公開APIは存在しない。

Anthropicがこのような分割提供方式を選んだ背景には、能力と安全性が単一の調整軸では両立できない段階に達したという認識がある。同社はアナウンスの中で「モデルの能力が、ガードなしで公開することが無責任になるレベルに達した」と述べており、AIフロンティアにおける新たな出荷哲学を体現する発表と言えるだろう。

ベンチマーク:主要評価指標で競合を大きく上回る

Anthropicはリリースと同時に、Claude Fable 5 / Mythos 5、Claude Mythos Preview、Claude Opus 4.8、GPT-5.5、Gemini 3.1 Proを対象とした5モデル比較表を公開した。ただし同社は、この表に掲載されているスコアがFable 5とMythos 5のうち高いほうの数値を採用していることを明記しており、アスタリスク付きの指標についてはMythos 5の数値が反映されている点に注意が必要だ。

IMG_0291-928x1024 Mythos級のAIモデル「Fable 5」が一般公開へ AnthropicがClaude Fable 5とClaude Mythos 5を同日発表

エージェンティックコーディングの評価指標であるSWE-Bench Proでは、Fable 5 / Mythos 5が80.3%を達成した。Claude Opus 4.8の69.2%、GPT-5.5の58.6%、Gemini 3.1 Proの54.2%と比較すると、フロンティアモデル群の中でも明確な差がついていることがわかる。知識労働の評価指標GDPval-AAでもFable 5は1932ポイントを記録し、Opus 4.8の1890ポイントを上回った。

一方でサイバーセキュリティ評価指標のExploitBenchでは、Mythos 5が78.0%を示しているのに対し、Fable 5は安全フィルターの働きにより攻撃的サイバータスクで0%という結果になっている。これはFable 5がMythos 5と同等のサイバー能力を持ちながら、その能力を意図的に封じていることを示すものだ。ベンチマーク数値を引用する際は、どちらのモデルのスコアかを区別することが重要になる。

ソフトウェアエンジニアリングについては、Cognitionが開発した「FrontierCode」評価においてFable 5がフロンティアモデル群の中で最高スコアを記録している。

この評価は高品質な本番コードベースの水準を満たしながら困難なコーディングタスクをこなせるかどうかを測るものであり、中程度の負荷設定でも他モデルを上回る結果となった。

安全設計の詳細 1000時間超のレッドチームで検証

フィルター設計の堅牢性については、外部の研究者を招いたバグバウンティ型のレッドチームが1000時間以上にわたって実施された。その結果、普遍的なジェイルブレイクは発見されなかったとAnthropicは述べている。ただし英国AI安全研究所(AISI)が初期の評価ウィンドウ内においてジェイルブレイクに向けた一定の進展を見せたことも同社は開示しており、完全無欠の設計を主張しているわけではない。

Mythosクラスのトラフィックには30日間のデータ保持要件が設定されており、モデルの学習データとして利用されることはない。また、人間によるすべてのアクセスはログに記録される。アライメント評価においては、Mythos 5の不整合な行動(欺瞞や不正利用への加担など)のレベルはClaude Opus 4.8と同程度で低いと評価されており、Fable 5も同様の評価が見込まれると同社は説明している。

価格と提供形態 Opus 4.8の2倍となるプレミアム価格設定

Claude Fable 5とClaude Mythos 5は、入力トークン100万件あたり10ドル、出力トークン100万件あたり50ドルで提供される。これはClaude Opus 4.8の5ドル・25ドルに対してちょうど2倍の価格設定であり、同価格のまま能力が向上したOpus 4.7からOpus 4.8への移行とは異なり、コスト面での意思決定が明確に求められる価格帯に位置する。プロンプトキャッシュを活用することで入力コストは90%割引となり、米国限定の推論オプションでは入力・出力ともに1.1倍の追加コストが発生する。

一般提供の範囲は広く、Claude API、claude.aiのPro・Max・Team・Enterpriseプラン、Claude Code、さらにAWS、Google Cloud、Microsoft Foundryを通じて利用できる。サブスクリプションプランでは6月9日から22日まで追加費用なしで使用でき、23日以降は使用量クレジットが必要になると発表されている。

エンタープライズ活用 StripeやGitHubからの報告

早期アクセスを利用した法人顧客からは、具体的な活用実績が報告されている。StripeはFable 5を使い、5000万行規模のRubyコードベースに対してコードベース全体のマイグレーションを1日で完了させたと報告した。これはチーム全員が取り組んでも2ヶ月以上かかる作業量に相当するという。GitHubのチーフプロダクトオフィサーは「複雑で長期的なコーディングタスクを、以前のモデルを超える自律性と信頼性でこなした」と評価し、Cursorはエージェンティックコーディングの評価指標「CursorBench」でFable 5が最高スコアを達成したと述べている。

法律分野ではEvenUp Law(法律分野のAIツールベンダー)がFable 5を活用し、盲目的なレビューで弁護士がFable 5の文書修正を従来モデルと同等かそれ以上と評価したと報告している。金融分野では先物市場大手のIMCが取引分析の評価でFable 5がほぼ全項目でトップスコアを獲得したと報告しており、事実確認・概念推論・根本原因分析・期待値分析のいずれにおいても高い精度を示した。

ライフサイエンスへの応用 新薬設計と生物学的仮説生成

Mythos 5の能力が最も注目される分野の一つがライフサイエンスだ。Anthropicの社内たんぱく質設計の専門家チームがMythos 5を用いた実験を行ったところ、創薬プロセスの一部において約10倍の加速が実現したという。14の標的たんぱく質に対して行った検証では、Mythos 5がたんぱく質デザインツールや生物情報学ツールを自律的に活用し、結合部位の選定からツール実行、失敗からの回復まで、通常なら科学者が担うすべての作業を実行した。14のうち9つのターゲットで有力な創薬候補が得られており、Anthropicは現在これらの詳細な調査を進めている。

分子生物学の仮説生成においても特筆すべき結果が報告されている。Mythosクラスの前のモデル群と盲目的な比較評価を行ったところ、社内の科学者たちはMythos 5が生成した仮説を約80%の確率で好ましいと評価した。さらにMythos 5が提唱したある大腸菌のたんぱく質に関する仮説は、独立して同じ問題に取り組んでいた別の研究機関が発表した論文(bioRxivに掲載)によって裏付けられたと同社は開示している。

ゲノミクス研究でも自律的な取り組みの成果が示された。Mythos 5は138種の動物から数百万細胞規模の単一細胞データを収集し、遠縁の生物種間でも同一の機能を果たす細胞を同定するための独自機械学習モデルを設計・学習させるという1週間以上にわたる作業をほぼ独力でこなした。完成したモデルは、最近『Science』誌に掲載された既存モデルを性能で上回ったにもかかわらず、モデルサイズは100分の1に抑えられていたという。

ビジョンとメモリの能力向上

視覚理解の面でも今回のリリースは大きな前進を示している。Fable 5は詳細な科学的図表から精密な数値を読み取ることができ、スクリーンショットのみからWebアプリのソースコードを復元するといった複雑なビジョンタスクにも対応する。以前のClaudeモデルはPokémon FireRedを攻略する際に補助ツールを含む複雑なハーネスを必要としていたのに対し、Fable 5は視覚入力のみのシンプルな構成でゲームをクリアしたとAnthropicは示している。

長期コンテキストとメモリの面では、Fable 5がファイルベースの永続メモリにアクセスできる状態でカードゲーム「Slay the Spire」をプレイした実験において、メモリの有無による性能差がOpus 4.8の3倍大きく現れた。Fable 5はゲームの最終アクトにOpus 4.8と比較して3倍の頻度で到達したという結果も得られている。こうした長期にわたるタスクの計画・委任・実行能力の向上が、今回のモデルを前世代と区別する重要な特性の一つとなっている。

業界への影響 AIフロンティアの「段階的開放」という新たな潮流

今回の発表が示す最も重要なシグナルは、AIの能力と安全性が単一のダイヤルで同時に調整できる段階を超えつつあるという点だ。単一モデルを二つの製品として出荷するという手法は、フロンティアラボがセキュリティリスクの高い能力をどのように管理するかをめぐる、新たなガバナンスモデルの実験でもある。

価格面ではOpus 4.8の2倍となるため、すべてのユースケースをFable 5に切り替えることが合理的な選択とはならない。Anthropicも「最も難度の高い長期的なタスクにはFable 5を、定型的な作業にはOpus 4.8を継続して使うことが合理的な選択になりうる」と示唆している。コスト対効果の観点から、利用シーンを見極めた使い分けが企業にとっての現実的な判断になるだろう。

Claude Mythos Previewの利用コストと比較した場合、今回リリースされたMythos 5はPreviewより高い能力を持ちながらコストは半額以下となっており、Project Glasswingを通じて利用するパートナー組織にとっては大幅なコスト低下を意味する。

いずれにせよ、Mythosクラスの能力が初めて一般の開発者とエンタープライズユーザーの手に届いたという事実は、2026年のAI業界における重要な画期として記録されることになるだろう。


本記事はAnthropic公式発表をもとに執筆しました。

Share this content:

コメントを送信