
文章圖片

文章圖片
智東西
作者 | 陳駿達
編輯 | 李水青
智東西1月22日報道 , 今天 , 百川智能發布了Baichuan-M3-Plus詢證增強醫療大模型 , 這一模型采用了M2-Plus同款的“六源詢證”方法 , 再次刷新行業SOTA , 幻覺率僅為2.6% 。
此外 , Baichuan-M3-Plus還首創了“證據錨定”技術 , 讓AI回答中的每個結論和證據都能精準匹配到原文獻的具體位置 , 據稱匹配率高達95% , 遠超行業40%-50%的平均水準 。
這一模型采用API模式對外提供服務 , 價格較前代模型下降70% , 并在發布后兩周內免費 , 為醫務工作者提供服務的機構可通過“海納百川計劃”長期免費使用 。
Baichuan-M3-Plus發布之際 , 智東西等媒體來到百川總部與百川智能創始人兼CEO王小川和百川智能模型技術負責人鞠強面對面溝通 , 他們分享了M3 Plus背后的技術細節 , 以及對行業熱點議題的看法 。
在交流中 , 王小川多次強調 , 醫療AI的核心目標應始終指向患者利益本身 。 他主動回應了近期張文宏關于“拒絕在病歷系統中引入AI、擔心影響年輕醫生成長”的觀點 , 直言如果因為擔憂AI影響醫生訓練而限制其應用 , 本質上就是將當下的患者作為醫生成長的成本 。
在他看來 , “AI+醫生”已在多個場景中展現出優于單純依靠醫生的潛力 , 而醫生同樣存在判斷偏差與“幻覺” , 從客觀數據看 , 當前醫療AI的幻覺率并不高于人類醫生 。
與此同時 , 王小川還談到 , 中國醫生對AI工具接納度偏低 , 并非模型能力不足 , 而是醫療系統高強度運轉與行業風氣的影響 。
一方面 , 國內醫生單日接診量遠高于海外 , 幾乎沒有時間真正使用和驗證AI工具;另一方面 , 醫療AI領域缺乏求真的狀態 , “假的東西太多了” , 真正有技術突破的產品反而難以快速建立信任 。
他呼吁 , 國內行業應該良性競爭 , 把醫療行業做得更真實 , 這樣發展速度才會加快 , 否則就會有很多“皇帝的新衣” 。
當智東西問及百川目前API客戶群體的畫像時 , 王小川回應道 , M3發布前百川已經擁有一批機構用戶 , 包括醫院和為醫院提供科研輔助能力的中小企業 。 M3模型發布后 , 伴隨著近期價格調整和合作伙伴關系的推進 , 客戶結構預計會發生較大變化 。
體驗鏈接:https://www.baichuan-ai.com
一、從六源詢證到證據錨定 , 如何把醫療AI“拉回白盒”上周 , 百川智能正式開源了當前業界醫學能力最出色的開源模型Baichuan-M3 。 該模型在權威醫療AI基準測試HealthBench中位列全球第一 , 表現超越了OpenAI最強模型 。
Baichuan-M3-Plus以M3底座為基礎 , 結合百川首創的“六元循證系統” , 在M3原有抗幻覺能力之上進一步降低了幻覺發生率 。
百川對“降低幻覺率”的執著 , 源于當前醫療AI領域中一些較為突出的問題 。 現場演示中 , 鞠強揭示了部分醫療AI產品存在的幻覺現象:AI生成的答案表面看來專業性強 , 引用了論文、指南、藥品說明書等來源 , 但實際內容錯誤率可能高達90% 。 這種“看似專業”的幻覺 , 對于經驗尚淺的醫生或普通用戶而言 , 潛藏的風險更為顯著 。
此類幻覺往往源于一個常見問題:AI引用的內容與其所要支持的表述之間缺乏實質關聯 。
對醫生和用戶來說 , 核驗這些引用的正確性過程繁瑣 , 需要耗費大量時間逐條核對 , 反而可能增加工作負擔 。
為此 , 百川創新性地引入“證據錨定技術” , 確保模型引用的段落與表述嚴格對應 , 并可精確定位至原文位置 , 使證據具備可核驗、可追溯的特性 , 最終實現診療輔助過程的“白盒化” 。
本次Baichuan-M3-Plus將采用低成本API的模式對外提供服務 。 通過模型架構、Infra等層面的工程優化 , Baichuan-M3-Plus的API價格較前代模型下降70% 。
發布后兩周內 , Baichuan-M3-Plus將完全免費 。 此外 , 百川智能創始人兼CEO王小川還宣布了“海納百川計劃” , 將面向所有為醫務工作者提供服務的機構免費提供詢證增強的M3-Plus API服務 , 以促進行業的協作和發展 。 王小川稱 , 這項免費服務的成本最高可能達到1億元左右 。
新模型API價格的大幅下調背后有多重驅動因素 。 鞠強介紹 , 上一代M2模型仍是稠密模型 , 而M3架構已經切換為MoE , 這一變化本身就能帶來不少成本收益 。
此外 , 百川還對業內廣受采用的投機采樣技術Eagle3進行了升級 , 加入了門控機制 , 進一步提升推理效率 。
二、王小川回應“AI影響醫生成長”言論:患者不該為醫生成長買單日前 , 張文宏拒絕把AI引入醫院病歷系統 , 認為其會影響年輕醫生成長的言論 , 引發廣泛討論 。
王小川在采訪中主動提到了這一討論 , 并做出全面的回應 。
他認為 , 患者利益應置于首位 , 當前“AI+醫生”模式已顯示出優于單純依靠醫生的潛力 , 符合醫學發展規律 。 若因擔憂AI可能影響醫生成長而限制其應用 , 實則可能阻礙對患者有益的技術進步——“醫生的成長不能以當下的患者作為成本” 。 醫生也有幻覺 , 而目前AI的幻覺率其實比醫生更低 。
在應用方法上 , 王小川認為尚有探索空間 。 若擔心醫生能力因AI而退化 , 可調整使用方式 , 例如讓AI輔助年輕醫生 , 在診療過程中提供實時提醒與校驗 。
王小川還談到了許多醫院做大模型的現象 , 他認為:“醫生不是造模型的 , 醫生是用模型的 , AlphaGo也不是圍棋選手造的 , 而是谷歌造的 。 ”雙方應做好專業分工 。
其實 , 百川與醫生群體有較為密切的合作 。 鞠強提到 , 百川與其它通用大模型公司的一個核心區別是 , 他們擁有一支專業的專職醫生團隊 。
這個團隊的成員擁有豐富的一線醫療經驗 。 有曾在國內三甲醫院任職的醫生以全職身份加入百川 , 此外百川還與合作的醫院建立了深度協作 , 有醫生長期駐場 , 提供醫學指導 。
第二部分的支持來自一個更為廣泛的專家網絡 。 百川內部的專職醫生團隊組建并管理著一個覆蓋所有主要臨床學科的兼職醫學專家團 , 規模達數百人 。 他們為百川的模型研發提供高質量的專業知識輸入和數據支持 。
三、察言觀色的醫療AGI三年內實現 , 國內采用率低不是模型原因王小川還給出了他對AGI(通用人工智能)級別AI醫生何時到來的預判 。 他認為 , 在具身智能領域 , 能完成做手術這類操作的AI可能還較遠 , 但進行表達、察言觀色的AGI級別AI醫生 , 有望在3年內實現 。
采訪中 , 有一組數據被反復提及 , 在美國醫療AI工具OpenEvidence在醫生群體中的滲透率已經達到45% , 但中國醫生對AI工具接納度、使用率仍不高 。
王小川認為 , 這一現象不是由模型能力導致的 , 而是與國內的醫療系統現狀和醫療AI行業的風氣有關 。
一方面 , 中國醫生的工作壓力很大 , 美國醫生可能一天需要看10個病人 , 而中國醫生可能是50-100人 , 平均到每個患者身上只有3-5分鐘 。 這導致國內醫生沒有時間好好地使用AI產品 。
另一方面 , 王小川認為國內的醫療AI產品并沒有真實地表達技術進展 , 虛假的產品過多 , 而真東西發布后也難以快速取得信任 。 他呼吁行業真誠地評價、表達技術進展 , 推動良性競爭 , 把醫療行業做得更真實 , 這樣速度才會加快 , 否則就會有很多“皇帝的新衣” 。
圍繞AI醫療的責任邊界、商業模式和未來方向 , 王小川認為 , 在現行法規下 , AI模型不能直接給出最終診斷 , 權力和責任仍由醫生承擔 , AI只是輔助工具;同時 , 美國已在部分地區允許AI直接開處方 , 這為中國未來制度探索提供了參考 。
在商業模式上 , 百川不會簡單復制美國OpenEvidence通過藥企營銷變現的路徑 , 而是堅持符合中國國情 , 在合規前提下通過學術體系等方式參與醫療生態建設 。 相比美國醫院提效帶來的巨大市場空間 , 中國醫療AI必須尋找不同的價值回報方式 。
在AI制藥領域 , 百川目前的重點不在早期分子發現或患者招募 , 而是通過藥效評價、藥物伴隨和數字化伴隨(Digital Companion)體系 , 提高真實世界中的藥物療效 , 本質上屬于精準醫療方向 。
針對醫療AI“幻覺”的可接受閾值問題 , 王小川指出 , 是否接受由醫院和醫療體系決定 , 而非由企業單方面設定;百川的定位是先輔助醫生 , 再服務患者 。 隨著醫生對AI工具的逐步適應 , 未來兩到三年內 , 醫療行業對AI的接受度有望顯著提升 , 這需要政策、行業伙伴與技術共同推動 。
結語:醫療AI熱度攀升 , 落地與信任成關鍵因素近幾周 , AI醫療健康領域迎來多個新玩家 , 國外的OpenAI、Anthropic , 國內的京東等大廠與多家創企都相繼發布了新品 , 賽道熱度不斷攀升 。
【王小川批醫療AI“假東西太多”!新模型幻覺率僅2.6%,兩周免費】不過 , 正如今天采訪中反復提到的那樣 , 影響醫療AI落地的因素不只是模型能力本身 。 如何獲取用戶和專業醫生群體的信賴 , 如何與真實場景結合并解決具體問題 , 或許比發布模型和產品本身更為關鍵 , 也更考驗企業的長期投入 。
推薦閱讀
- 游戲新王!AMD銳龍7 9850X3D開啟預售
- SaaS舊王隕落,RaaS新王加冕,企業軟件的下一場范式更替
- 游戲新王!AMD銳龍7 9850X3D開啟預售:七彩虹AM5全系主板更新支持
- 華為新一代“跳水王”,16GB+512GB+麒麟9020,等等黨“又贏了”
- 一出手就是王炸?突破“永不落地”無人機技術,外媒:這只是開始
- 王騰稱第一次創業壓力山大:更理解雷總的勇氣了
- Skills 即個人資產
- 開源新王炸!10B多模態小模型屠榜,性能媲美20倍巨無霸
- 華為手機誕生“銷量王”,麒麟9系+3D人臉,16+512GB國補后更香了
- 黃仁勛急不急?英偉達的三大王牌芯片,在中國都不行了
