“iFold”,蘋果AI新成果

“iFold”,蘋果AI新成果

文章圖片

“iFold”,蘋果AI新成果

文章圖片

“iFold”,蘋果AI新成果

文章圖片

“iFold”,蘋果AI新成果

起猛了 , 蘋果怎么搞起跨界AI模型了??
發布了一個基于流匹配的蛋白質折疊模型SimpleFold , 被網友戲稱為“iFold” 。
SimpleFold沒有花里胡哨的專屬模塊設計 , 就靠通用的Transformer模塊 , 搭配流匹配生成范式 , 3B參數版本追平了該領域頂流模型谷歌AlphaFold2的性能 。
蘋果這波跨界看來玩的是化繁為簡 。

MacBook Pro跑起來不費力首先來說說蛋白質折疊是怎么一回事 。
核心是將“一串”氨基酸折成特定的3D形狀 , 這樣蛋白質才能發揮作用 。
而蛋白質折疊模型就是從氨基酸的一級序列預測它的三維空間構象 。
之前最厲害的模型 , 比如谷歌的AlphaFold2 , 雖然實現了突破 , 但用了很多復雜的專屬設計 。
比如要分析大量相似蛋白質的序列 , 依賴多序列對比(MSA)構建進化信息、靠三角注意力優化空間約束、推理時需調用超算級算力 , 普通實驗室不太能用得起 。
但這款“iFold”用通用AI框架解決了這個問題 。
SimpleFold在架構上采用多層Transformer編碼器作為核心骨干 , 僅通過自適應層歸一化適配蛋白質序列特征 , 相當于用“通用工具箱”解決專屬領域難題 。
【“iFold”,蘋果AI新成果】核心創新在于引入流匹配生成技術 。
不同于擴散模型的逐步去噪 , 流匹配通過學習從隨機噪聲分布到蛋白質構象分布的光滑映射 , 實現一步式生成原子坐標 。
在訓練階段 , 團隊構建了包含900萬條數據的混合數據集 , 訓練出了100M到3B參數的多尺度模型 , 其中SimpleFold-3B在CAMEO22 基準測試中 , 性能達到AlphaFold2的95% 。
在CASP14高難度測試集上 , 超越同類流匹配模型ESMFold 。
還值得一提的是效率 , 在搭載M2 Max芯片的MacBook Pro上 , 處理512殘基序列的推理時間僅需兩三分鐘 , 遠超傳統模型的小時級耗時 。

研究團隊這項研究的第一作者Yuyang Wang本科畢業于同濟大學 , 后赴美國卡內基梅隆大學深造 , 陸續取得機械工程碩士、機器學習碩士以及機械工程博士學位 , 長期的學習為其相關領域研究筑牢根基 。
他有在Momenta從事強化學習研發的實習經歷 , 還曾在蘋果公司擔任AI/ML Resident , 專注于擴散模型研究 , 之后成為蘋果的機器學習研究員 。
通訊作者是華人機器學習工程師Jiarui Lu , 本科畢業于清華大學 , 就讀期間還在朱軍教授實驗室中擔任研究助理 。
隨后 , Lu在卡內基梅隆大學取得了機器學習碩士學位 , 畢業后于2020年加入蘋果公司 。
曾經主導了一套關于大模型工具調用能力的Benchmark——ToolSandbox這一蘋果開源成果 。
關于這款“iFold” , 有感興趣的、想扒技術細節的朋友可戳文末鏈接~
論文地址:https://arxiv.org/abs/2509.18480代碼地址:https://github.com/apple/ml-simplefold
參考鏈接:[1
https://x.com/iScienceLuvr/status/1970787581248905454
本文來自微信公眾號“量子位” , 作者:關注前沿科技 , 36氪經授權發布 。

    推薦閱讀