AI會客廳實錄|對話北京中關村學院×中關村人工智能研究院何亮

AI會客廳實錄|對話北京中關村學院×中關村人工智能研究院何亮


2025人工智能計算大會(AICC2025)特別策劃了“AI會客廳”直播活動 , 由媒體人和與會嘉賓共同圍繞ABI、人工智能+行動、低空經濟、AI4S等產業前沿話題展開探討 。
AI4S作為當前產業界熱議的核心議題之一 , AI制藥、材料科學、智慧育種、氣象預測等等領域的實踐都正在對普通大眾的日常生活產生深刻影響 。 AI4S的產學研發展應用現狀如何?哪些領域正在加速變革?其中會涉及哪些倫理爭議和風險?為AI+人才培養帶來了哪些新的命題?智東西總編張國仁與北京中關村學院×中關村人工智能研究院的生物大模型首席研究員何亮共同就AI4S相關前沿話題展開對話 , 以下內容根據直播整理 。

張國仁:大家下午好 ,2025人工智能計算大會“AI會客廳”的最后一位嘉賓 , 是來自北京中關村學院、北京中關村人工智能研究院的生物大模型首席研究員何亮 。 何老師長期專注于生物大模型與科學基礎模型研究 , 曾在微軟亞洲研究院和微軟研究院科學智能中心等單位開展科研工作 , 在生物大模型、AI+藥物設計等領域有著深厚的積累和儲備 。
首先我們還是圍繞AI For Science這個詞的展開 。 AI4S在科學研究領域應用比較廣泛 , 但是跟普通人關系好像沒那么大 。 它的實際意義和對研究的影響如何?請何老師給我們先簡要在這方面介紹一下 。
何亮:首先說到AI4S研究 , 其實在上個世紀大家也會有類似的疑問:為什么要發射衛星上天 , 為什么要造火箭?而現在大家都看到 , 這些技術已經深刻影響了我們的生活 。 我也可以引用北京中關村學院的研究理念來開始今天的分享——“極基礎、極應用、極交叉” 。 先說與生活最相關的“極應用” 。 AI應用正在影響人們生活的方方面面 , 比如生物領域常用的洗衣粉 , 其中的生物酶本質上是一種蛋白質 , 這種酶的效果好不好、去污能力強不強 , 都需要通過研究與優化 。 再比如材料領域 , 很多人已經使用電動汽車 , 對電池和能源性能非常關注 。 如何讓電池續航更強、冬天掉電更慢 , 新材料的研究就能直接帶來改進 。 還有智能育種 , 我們通過AI幫助培育優良品種 , 可直接用于農業 , 關系到糧食安全 。 AI4S的重要使命是加速科學發現 。 過去從科研到應用可能需要十年甚至二十年 , 而現在借助AI工具 , 可以把這一周期縮短到幾年甚至幾個月 。 “極交叉”則指多個領域的共性問題交匯 , AI4S的價值就在于促進這些領域的融合創新 。 對公眾而言 , 我們今天享受的科技成果 , 往往源自多年前的科學突破 。 從科學發現到應用再到市場推廣 , 正如那句話所說:“流水不爭先 , 爭的是滔滔不絕” , 科研亦是如此 。
張國仁: AI+科研最近被列為了國務院發布的人工智能+行動計劃重要領域之首 , 從您的研究和實踐來看 , 這個領域的研究對中國未來的發展意義有多么重大?
何亮:AI4S的重要性非常大 。 剛才我們提到 , 從極基礎研究到極應用 , 它覆蓋了創新的整個鏈條 。 科學本身是創新的源頭動力 。 科研發現往往是一個漫長的過程 , 如果能通過AI提升源頭創新的速度 , 就能更快地享受到科技進步帶來的紅利 。 對國家而言 , AI4S是建設科技強國的重要基礎 。 只有在生物科技、材料、農業、氣象等關鍵領域實現突破創新 , 才能真正讓科技發展成果回饋社會 , 使國家更強大 。 另一方面 , 在當今國際競爭激烈的格局下 , AI4S也是國家保持領先的關鍵 , 需要持續的技術創新和深入研究 。
張國仁:咱們國家去做AI4S有哪些獨特的優勢?
何亮:首先 , 我們有體制優勢 , 能夠高效整合人才、算力、平臺和數據等資源 , 這是許多國家難以做到的 。 其次 , 我國擁有龐大的數據基礎 , 例如醫療病例、材料測試、氣象觀測等 , 這為AI模型的訓練與應用提供了堅實支撐 。 最后 , 我國科研人才數量多、基礎好 。 AI人才與生物學家、材料科學家、農業專家、氣象學家之間的跨界合作 , 正在不斷產生思想與算法的火花 , 帶來更多可落地、甚至突破性的成果 。
張國仁:回到應用層面 , 隨著AI4S的發展 , 哪些領域最受益?
何亮:我畢業后就投身AI4S , 更具體地說是AI for Life Science(生命科學)領域 。 從實踐來看 , 生命科學和生物醫藥首先受益 。 眾所周知 , 傳統制藥周期長、成本高——“兩個十”:十年時間、十億美元投入 。 而AI+制藥可以將周期從十年縮短到幾個月 , 大幅提升效率 。 第二個受益領域是材料科學 。 由于材料元素組合復雜、搜索空間巨大 , AI能幫助快速篩選出具有特定屬性的新材料 。 第三是農業育種 。 中國作為人口大國 , 糧食安全是國家戰略 。 AI通過基因組數據分析 , 可以指導高產、耐旱、抗蟲等優良特性品種的培育 。 第四是氣象能源領域 。 例如在西北地區開展風力發電 , 借助天氣預測或風能預測大模型 , 就能更好地規劃與優化發電 。
張國仁:聊一個跟您專業直接相關的話題 , 也是AI4S比較受大眾關注的一個點 , 2024年諾貝爾化學獎頒給了蛋白質結構預測領域的科學家 , 其中很重要的功能是AlphaFold3大模型 , 這個對行業來說意味著什么意義?
何亮:這太重要了 。 我剛進入AI4S領域沒多久 , AlphaFold就出現了 。 蛋白質結構預測是長期存在的科學難題 , 而AlphaFold3首次讓模型預測達到實驗級精度 , 這是一次里程碑式的突破 。 這意味著科學界正式認可AI具備解決重大科學問題的能力 , AI4S在科研體系中擁有了應有的一席之地 。 更重要的是 , 它給從業者帶來了信心和鼓舞:既然AI能解決這一重大問題 , 就可能在更多科學領域實現突破 , 推動人類科技的整體進步 。
張國仁:好的 , 說到AI4S對科學研究的幫助 , 您前面提到了一些例子 , 被創造出來的可以叫作“生物”嗎 , 如果是的話 , 可能會涉及到一些倫理的問題 , 包括基因編輯 , 那會有安全上的隱憂嗎?或者在科學界 , 你們在應用這些技術的時候有沒有一些安全上的應對方法策略 , 在行業里面國際上形成一些共識?
何亮:通過AI4S設計出的第一個病毒噬菌體雖然名稱中帶“病毒” , 但對人類沒有危害 。 然而 , 這也提醒我們潛在的倫理風險 。 AI在一定程度上降低了制造潛在危險生命體的門檻 , 使其變得更容易被創造出來 。 除此之外 , 還有諸如公平性、可用性、環境影響等多方面的倫理問題 。 總體來說 , 首先我們應從AI本身出發 , 踐行“負責任的AI”(Responsible AI) , 確保AI的使用在合理監管下進行 。 其次 , 我認為需要建立跨行業的委員會或評審監督機制 , 對新技術成果在推廣和擴散階段進行監管和評估 。 當然 , 這并非一國之事 , 必須推動國際合作 。 值得肯定的是 , 我國在AI4S倫理治理方面已取得一定成功 。 總體而言 , 倫理規范應走在科技發展的前面 , 這應被放在極為重要的位置 。
張國仁:確實是行業野蠻發展必然會面對的一些問題 。 回到您的研究 , 現在是不是有些AI工具已經在研究中占據主導位置了?如果說在一些數據上跟你實際時間有沖突 , 會如何處理呢?
何亮:這個問題可以分兩方面看 。 一是我個人在科研過程中的AI應用 , 二是AI在科研題目中的應用 。 就我個人而言 , 大語言模型已經非常強大 。 無論是科研中的數據收集、文獻調研 , 還是實驗過程中的代碼編寫、調試(debug) , 以及論文撰寫和潤色 , AI都能提供很好的幫助 。 它是一個強有力的工具 , 正在顯著加速科研進程 。 但AI也存在“幻覺”問題 , 因此我們需要保持清醒的判斷 , 確保生成內容與事實相符 。 第二個方面是AI在生命科學全流程中的應用:從靶點發現、結構解析、小分子設計 , 到臨床前驗證 , AI貫穿始終 。 以我最近發表在《Nature Machine Intelligence》上的論文為例 , 我們研究如何優化蛋白質序列 。 濕實驗無法窮舉所有突變組合 , 哪怕是幾個氨基酸位點的突變 , 組合空間都可能達到數十億甚至上百億種 , 極其耗時耗力 。 我們的做法是先通過部分濕實驗獲得數據 , 讓AI學習其中的規律 。 掌握規律后 , AI可以在虛擬空間中進行快速實驗 , 加速驗證整個搜索空間 。
此外 , 我們引入強化學習等算法來探索這一巨大空間 。 模型建立之后 , AI可以迭代地進行搜索和優化 。 結果顯示 , 這種方法的成功率很高 , 也找到了性能優異的突變方案 。 也就是說 , 從濕實驗觀測到AI生成與再驗證的全過程 , AI都深度參與其中 。 但最終的驗證仍必須依賴客觀的實驗世界 。
張國仁:具體到你們應用這些AI的工具 , 前面探討的更多是基于這些現象或是大面上 , 具體到你們應用的工具 , 從算力到大模型 , 或者一些專用的領域 , 大概用到了哪些方面的東西?讓我們感受更明確一些 。
何亮:目前國內的大語言模型發展非常快 , 比如DeepSeek、千問等模型 , 在中文理解方面相比ChatGPT更具優勢 。 很多時候我會在工作中交叉使用多個模型 , 包括ChatGPT , 用于英文文獻閱讀與信息整理 。
張國仁:國內有一些專用的工具嗎 , 像AlphaFold3專門做蛋白質研究 , 有專用于某些領域的研究工具嗎?
何亮:有的 。 我國也在積極研發自己的生物結構預測模型和科學基礎模型 。 雖然與國際領先水平相比 , 我們在這一領域所占比例還不算大 , 但發展速度很快 。 這也是我們持續努力、追趕并力爭引領的方向 。
張國仁:明白 , 隨著AI的加入 , 一方面是一個好的助手 , 好的工具 。 另一方面是不是很大程度上提高成本的投入 , 有的實驗需要采購大的超算 , 對于科學研究的成本是不是一種增加?
何亮:實際上 , AI科研的成本是階段性的 。 最消耗算力的是模型預訓練階段 , 包括蛋白質模型和科學大模型的基礎訓練 , 這部分顯卡資源需求確實較高 。 但在完成預訓練后 , 推理階段的算力需求會大幅下降 , 因此總體投入在后期并不會持續高企 。 我的理解是 , AI科研的成本主要集中在早期模型構建階段 。
張國仁:也是一個階段性的 , 不是每時每刻一定是高消耗的狀態 。 其實還有一個很本質的問題 , 我們剛才說到AI For Science , 就是科學家要用AI , 科學家首先得用好AI , 是不是也得懂AI , 對于AI+科研的人才 , 會有什么樣的要求嗎?
何亮:我認為AI+科研的人才培養 , 關鍵在于跨學科 。 未來應當培養既理解AI、又熟悉專業領域的復合型人才 。 一個人不可能精通所有領域 , 但需要在AI方法和學科知識之間建立橋梁 。
以模型構建為例 , 必須理解領域數據的特點——哪些數據合理、哪些可被AI有效利用 。 畢竟 , 如果輸入數據質量差 , 輸出結果也不會可靠 。 因此高質量數據的整理與理解需要領域專家深度參與 。
我本身是做AI出身的 , 也在與生物學同事的合作中不斷學習 。 不同學科的思維差異巨大 , 彼此理解的過程本身就是創新的來源 。
在學生培養方面 , 也應鼓勵交叉思維 , 知識結構既有側重又有交叉 , 促進不同領域之間的深度合作與學習 。
張國仁:我覺得您說的這兩個非常關鍵 , 一個是人工智能教育應該從娃娃抓起 , 好像我們現在從小朋友到長輩 , 大家都在使用互聯網 , 大家覺得這不是一個需要學習的東西 , 同樣人工智能在下一代也是一樣要成為他們習以為常的工具 , 第二方面各個領域的人互相的配合 , 互相結合 , 去完成一個事情也非常重要 , 所謂跨學科交叉學習更為重要 。
【AI會客廳實錄|對話北京中關村學院×中關村人工智能研究院何亮】感謝何老師對我們深入淺出對于AI For Science這個領域 , 對普通人既遠又近的領域的分享 , 讓我們有了更多認識 , 也感謝觀眾對我們的關注 。

    推薦閱讀