RNA預測超95%專家,OpenAI發布生命科學大模型

RNA預測超95%專家,OpenAI發布生命科學大模型

文章圖片

RNA預測超95%專家,OpenAI發布生命科學大模型

文章圖片

RNA預測超95%專家,OpenAI發布生命科學大模型

智東西
編譯 | 高遠矚
編輯 | 漠影
智東西4月17日消息 , 新藥研發平均耗時10到15年 , 這是生命科學領域長期面臨的困境 。 如今 , OpenAI將目光投向這一賽道 。 4月16日 , OpenAI發布了其首個行業專用高級推理模型GPT-Rosalind , 專為生物學、藥物發現和轉化醫學定制 , 試圖用AI的力量大幅壓縮早期研發周期 , 提高整個管線的成功率 。
該模型得名于DNA雙螺旋結構的關鍵貢獻者羅莎琳德·富蘭克林 , 已作為研究預覽版登陸ChatGPT、Codex及API , 目前僅向符合條件的美國企業客戶開放 , 且預覽期內不消耗現有額度 。
與此同時 , OpenAI還開源了Codex生命科學研究插件 , 免費連接超50個公共數據庫與生物信息學工具 , 并已與安進(Amgen)、莫德納(Moderna)、洛斯阿拉莫斯(Los Alamos)國家實驗室等機構達成首批合作 。

一、行業專用模型:OpenAI為何選中生命科學?OpenAI將生命科學作為行業專用模型的切入口 , 背后有清晰的戰略邏輯 。
一款新藥從靶點發現到監管批準平均需要10到15年 , 而早期發現階段的任何效率提升 , 都會在下游產生復合效應——更優的靶點選擇、更強的生物學假設、更高質量的實驗設計 , 最終提高整個研發管線的成功率 。 然而 , 科學家的工作流長期被大量文獻、專業數據庫、實驗數據和不斷演化的假設所拖累 , 耗時、碎片化且難以規模化 。
GPT-Rosalind 在化學、實驗設計與分析等關鍵任務上的得分均明顯優于前代模型
GPT-Rosalind針對科學工作流進行了深度優化 , 將工具使用能力與化學、蛋白質工程、基因組學的理解相結合 , 支持證據整合、假設生成、實驗規劃等多步研究任務 。
OpenAI表示 , 該模型不僅讓現有工作更高效 , 更能幫助科學家探索更多可能性、發現被忽略的聯系 , 并更快地得出更好的假設 。

二、RNA預測超95%人類專家 , 多項基準領先在性能評估中 , GPT-Rosalind在生物信息學基準BixBench上 , 取得了已發布模型中的最高分 。
GPT-Rosalind 在 BixBench 上的表現全面超越 Gemini、Grok 及 GPT 系列前代模型
在涵蓋文獻檢索、序列操作、實驗方案設計等11項任務的LABBench2基準中 , GPT-Rosalind有6項任務優于OpenAI最新的通用旗艦模型GPT-5.4 , 其中最顯著的提升來自分子克隆實驗設計(CloningQA) 。
更為關鍵的驗證來自與AI基因療法公司Dyno Therapeutics的合作 。 雙方使用未公開、無污染的RNA序列 , 評估模型在序列到功能預測和序列生成上的表現 。 歷史數據中 , AI生物學領域的人類專家共有57個得分 。
當直接在Codex應用中評估時 , GPT-Rosalind在十次提交中的最佳結果:序列功能預測排名高于95%的人類專家 , 序列生成排名約為84%的人類專家 。

三、開源插件+頂級合作:打造生命科學AI生態除了模型本身 , OpenAI還同步在GitHub上開源了Codex生命科學研究插件 。 該插件集成了超過50個公共多組學數據庫、文獻源和生物信息學工具 , 涵蓋人類遺傳學、功能基因組學、蛋白質結構、生物化學、臨床證據等方向 。 插件對所有用戶免費 , 不限于GPT-Rosalind , 普通模型也可使用 , 為科研人員提供了一個靈活、可復用的工作流編排層 。
OpenAI Codex 的「Life Science: Research」插件 , 提供覆蓋多領域的生命科學研究工作流 , 支持路由、證據合成與并行子代理分析
在生態合作方面 , OpenAI已與安進(Amgen)、莫德納(Moderna)、艾倫研究所(Allen Institute)、賽默飛世爾科技(Thermo Fisher Scientific)等機構合作 , 將GPT-Rosalind嵌入實際研發工作中 。
安進公司AI與數據高級副總裁Sean Bruich表示:“生命科學領域每一步都要求精準 , 問題極其復雜 , 風險極高 。 與OpenAI的合作讓我們能以創新的方式應用其最先進的能力 , 加速藥物送達患者 。 ”
此外 , OpenAI正與洛斯阿拉莫斯國家實驗室探索AI引導的蛋白質和催化劑設計 , 包括在保持或改善關鍵功能的前提下修改生物結構 。

結語:OpenAI入場垂直賽道 , 前路仍待破局GPT-Rosalind在RNA預測等任務上表現亮眼 , 其開源插件也以免費的形式降低了科研工具的使用門檻 。
但其爭議同樣不容忽視:該模型目前僅面向美國企業客戶 , 技術普惠性受限;在LABBench2的11項任務中仍有5項未超越通用模型 , 性能優勢尚不全面 。 此外 , 該模型以羅莎琳德·富蘭克林命名 , 被批評是在消費一位曾遭受不公的女科學家 , 而非真正的致敬 。
在安全層面 , OpenAI雖強調通過信任訪問機制(trusted access)防范生物技術濫用 , 但批評者認為 , 任何強大的生物學推理模型都可能被惡意用于設計危險病原體或毒素 , 而目前缺乏獨立的第三方安全評估來驗證這一制度的有效性 。
就在GPT-Rosalind發布前兩天 , OpenAI推出了面向防御性網絡安全的GPT-5.4-Cyber , 競爭對手Anthropic也發布了前沿AI模型Mythos 。
AI巨頭正加速向行業垂直模型賽道滲透 , 但生命科學領域的特殊性決定了 , 從技術突破到最終成藥 , 中間仍隔著漫長的臨床驗證和監管審批 。 開源插件或許能降低科研的工作門檻 , 但技術公平性、安全性驗證等問題 , 仍是其走向廣泛落地前必須直面的大山 。
【RNA預測超95%專家,OpenAI發布生命科學大模型】來源:OpenAI、路透社、BlockBeats

    推薦閱讀