OpenAIがGPT-Rosalindを発表、生物科学研究を強化したモデルに。
Image:OpenAI
OpenAIは2026年4月16日(現地時間)、生命科学分野に特化した大規模言語モデル「GPT-Rosalind」を発表した。同社がこれほど明確に特定の科学領域へ的を絞ったモデルをリリースするのは初めてのことで、創薬・生化学・トランスレーショナルメディシン(基礎研究から臨床応用をつなぐ橋渡し医学)を主な対象領域としている。
モデルの名称は、20世紀のイギリス人科学者ロザリンド・フランクリン(Rosalind Franklin)に由来する。フランクリンはX線結晶構造解析の手法を用いてDNAの二重らせん構造の解明に大きく貢献した人物だが、その功績はジェームズ・ワトソンとフランシス・クリックのノーベル賞受賞に際して長らく適切に評価されてこなかった。OpenAIがこの名をモデルに与えたことには、科学的功績の正当な評価を象徴する意味合いも込められていると見られる。
生命科学研究が抱える構造的な課題
なぜ今、生命科学に特化したAIモデルが必要とされているのか。その背景には、現代の生命科学研究が置かれている状況がある。
過去数十年にわたるゲノム解読や蛋白質生化学の蓄積によって、研究者が扱わなければならないデータ量は天文学的な規模に膨れ上がっている。さらに生命科学は、遺伝学・神経科学・免疫学・構造生物学といった専門性の異なるサブフィールドが複雑に入り組んでおり、それぞれが独自の用語体系と研究手法を持つ。たとえば脳内で活性化する遺伝子を研究している遺伝学者が、神経生物学の文献を読み解こうとすれば、異分野の膨大な専門知識の壁に阻まれることになる。
OpenAIのライフサイエンス製品部門を率いるユニュン・ワン氏は、こうした課題を解決するためにGPT-Rosalindが設計されたと説明している。研究の進歩を阻んでいるのは、科学そのものの難しさだけではなく、研究ワークフローの複雑さにもある。データを探し出し、適切なデータベースに照会し、最新の論文を読み込み、仮説を立案し、実験をデザインするという一連のプロセスは、それぞれが高度な専門性を要しながら、今まで研究者一人ひとりが手作業でこなしてきた。
モデルの技術的な仕組み
GPT-Rosalindは、ChatGPTと同じAIスタックの上で動作するが、その内部に「ライフサイエンス研究プラグイン」が統合されている点が大きな特徴だ。このプラグインを通じて、ヒトゲノム・機能的ゲノミクス・蛋白質構造・生化学・臨床エビデンス・公開試験カタログなど、50以上の専門データベースおよびツール群にアクセスできる仕組みになっている。
一般的な汎用モデルがオープンウェブを自由に検索するのとは異なり、GPT-Rosalindはキュレーションされた信頼性の高い科学データソースのみを参照し、その結果を自身の分析や実験計画に統合する設計だ。これにより、研究に不要な情報ノイズを排除しながら、精度の高い科学的推論を実現しようとしている。
また、モデルは生物学における50の代表的なワークフローを対象に訓練されており、証拠の統合・仮説の生成・実験計画の立案・複数ステップにわたる研究タスクの実行といった作業を支援するよう設計されている。研究者は、特定のメカニズムを提案させたり、生物学的仮説の優先順位付けを行わせたり、アッセイの戦略を描かせたり、追加実験を提案させたりすることができ、その際にモデルが参照したデータやツールの出典も示される。
性能ベンチマーク
GPT-Rosalindの性能は、公開されているベンチマークからも確認できる。バイオインフォマティクスの実際のタスクを基に構築された評価指標「BixBench」では、GPT-Rosalindが0.751のパス率を記録し、結果を公開しているモデルの中でトップスコアを獲得した。


また「LABBench2」においては、前世代にあたるGPT-5.4を11項目中6項目で上回った。ただしGPT-Rosalindは生命科学に特化したモデルであり、それ以外の汎用タスクではGPT-5.4に劣るパフォーマンスとなることも明示されている。この点はOpenAI自身も認めており、あくまでドメイン特化型モデルとして位置づけられている。
参加パートナー企業と研究機関
今回の発表では、製薬・バイオテクノロジー業界を中心とした複数のパートナー企業・研究機関との協力関係も明らかにされた。
アムジェン(Amgen)のAI・データ担当シニアバイスプレジデントであるショーン・ブルーチ氏は、「生命科学の分野は各ステップで高い精度が求められる。問いは複雑であり、データは非常に特殊で、賭けられているものは計り知れないほど大きい」とコメント。この協力によって患者への医薬品提供を加速できると期待を示した。
モデルナ(Moderna)のCEOステファン・バンセル氏は、GPT-Rosalindが「複雑な生物学的証拠を横断して推論する」能力を持つことで、科学チームが知見を実験ワークフローへと転換しやすくなると評価した。
NVIDIAのヘルスケア・ライフサイエンス担当バイスプレジデントであるキンバリー・パウエル氏は、ドメイン推論と加速コンピューティングの融合が「従来なら何年もかかるR&Dを即座に実行可能な科学的洞察へと圧縮する」と述べた。
アレン研究所(Allen Institute)のCTOアンディ・ヒックル氏は、GPT-Rosalindが際立っている点として、データの検索・整合といった手動作業をエージェント型ワークフローの中で「一貫性と再現性を持って」実行できることを挙げた。
このほか、ロスアラモス国立研究所とはAIを活用した蛋白質設計・触媒設計の共同研究が進められており、Dyno Therapeuticsもモデルのテストと評価に参加することが発表された。また、サーモフィッシャーサイエンティフィック(Thermo Fisher Scientific)も連携先として名を連ねている。
アクセスは厳格に制限
現時点では、GPT-Rosalindへのアクセスは一般公開されていない。提供対象はアメリカ国内のエンタープライズユーザーに限定されており、資格審査と安全性レビューを経た上でのみ利用が可能だ。
このアクセス制限の背景には、安全保障上の懸念がある。100名以上の科学者からなる国際的な連合が、AIの訓練に使用される生物学的データへのより厳格な規制を求めて声明を出しており、病原体設計リスクが具体的な懸念事項として挙げられている。OpenAIが慎重な段階的展開を選んだのは、こうした外部からの警告を無視しない姿勢の表れとも読める。
一般ユーザー向けには、ChatGPT内で標準モデルを通じた「ライフサイエンス研究プラグイン」の形でアクセスできる部分はあるが、エンタープライズ向けに提供される高度な推論レイヤーとは別のものだ。
OpenAIのライフサイエンス戦略における位置づけ
今回のGPT-Rosalind発表は、単発のモデルリリースではなく、OpenAIが「Life Sciences model series(ライフサイエンスモデルシリーズ)」と銘打った長期的な製品ラインの第一弾として位置づけられている。
OpenAIは公式ブログの中で、「今回のリリースを、社会にとって深く重要な領域における科学的発見を加速するAI構築への長期的なコミットメントの始まりと捉えている」と述べており、ヒトの健康から幅広い生物学研究に至るまでの継続的な関与を示唆した。
このタイミングは偶然ではない。医薬品が米国で承認されるまでには、標的の同定から規制当局の認可まで平均10〜15年を要するとされており、その大半は「画期的な発見の瞬間」ではなく、数千本の論文の解析、データベースへの照会、試薬の設計、曖昧な実験結果の解釈といった地道な作業に費やされている。この「研究の下積み」部分をAIで圧縮できれば、創薬の速度と効率は劇的に変わる可能性がある。
グーグル・ディープマインドをはじめとする競合他社も生命科学AI分野に積極的に参入しており、大学や専門研究機関を含めた競争は激化している。OpenAIがこのタイミングでGPT-Rosalindを投入したのは、同分野における主導権を早期に確立しようとする戦略的な判断といえる。
GPT-Rosalindは、生物学ワークフローへの特化、50以上の専門データベースとの統合、そして主要製薬企業・研究機関との実用展開という三つの柱から成る、OpenAIにとって前例のない生命科学特化型モデルだ。創薬の早期探索フェーズにかかる時間とコストを大幅に削減できるポテンシャルを持っており、製薬・バイオ業界における応用が本格化すれば、研究インフラの在り方を変える可能性を秘めている。現時点のアクセス制限と安全審査のプロセスがどの程度の速さで緩和されるかが、普及の鍵を握るだろう。
公式発表:https://openai.com/index/introducing-gpt-rosalind
Share this content:



コメントを送信