開源 AI 及其在當今世界中的重要作用

開源 AI 及其在當今世界中的重要作用

當團隊準備部署大語言模型時 , 他們面臨一個重要選擇:是否向全世界公開系統的運作機制 , 包括參數、訓練數據和權重輸入的詳細信息?還是將所有這些信息保密 , 由制造商嚴格保護?由此產生的\"開源\"與\"閉源\"之間的爭論 , 在政府和商界討論 AI 時總是回響在會議廳中 。
科技公司的領導者也必須應對這些問題 。 他們需要從戰略角度和其他方面考慮 , 究竟是公開相關數據更好 , 還是保密更好 。
戰略與國際研究中心的 Masao Dalhgren 寫道:\"圍繞 AI 安全的新興公民社會辯論——特別是關于開放基礎模型的辯論——值得特別關注 。 \"他提到了一場\"非常激烈的辯論\"并解釋了其背景 。 \"與 GPT-4 等閉源模型不同 , Llama、Mistral 或 Qwen 等開放基礎模型的開發者公開發布模型的底層參數('權重') , 允許終端用戶檢查、修改和操作這些模型 。 隨著開源模型的性能接近其閉源對手 , 一些人認為開源模型的分發可能帶來誤用的'極端風險' 。 與此同時 , 其他人則強調了開源模型在研究、安全和國家競爭力方面的好處 。 \"
這篇文章主要關注美國的國防應用 , 但開源辯論在其他領域也同樣存在 。
主權、信任與合作
最近的一次專家小組會議展現了選擇開源或閉源設計背后的一些邏輯 。 MacKenzie Sigalos 采訪了 Dinesh Maheshwari、Karl Zhao、Charles Fan 和 Jose Plehn , 討論了這些選擇以及如何通過國家安全等視角來做出這些決定 。
其中一個共識是 , 美國總體上缺乏開源領導者 。
Plehn 說:\"美國的 AI 生態系統似乎變得更加封閉了 。 \"他描述了其公司在開發\"獨特全球標識符\"方面的工作 , 該標識符旨在解決版權或專有權侵犯的擔憂 。
他說:\"我們正在盡力開源數據 , 這意味著這些數據可以用來訓練模型 , 也可以讓模型更加準確 。 \"
Zhao 補充道:\"從基礎模型的角度來看 , 現在確實有更多開源模型來自中國...而美國的前沿實驗室基本上選擇了更加閉源的方法 。 \"
信任問題
Maheshwari 在談到這種二元性時 , 建議開源系統可以在信任環境中推廣 。
他說:\"開源關乎信任 。 這不僅僅是開源權重 , 還包括開源數據 。 這意味著開源模型、架構、元參數 , 并且知道它可以被復制和審計 。 這就是建立信任的方式 。 \"
至于中國的主導地位 , 他指出 , 被廣泛譽為\"開源\"系統的 DeepSeek 本身并不完全開源 。
他說:\"說句實話 , DeepSeek 是半開半閉的 。 數據不開放 。 你不知道它是基于什么訓練的 。 模型參數需要開放 。 \"
Fan 談到了以新方式利用記憶 , 這將影響開源或閉源系統的選擇 。
他解釋道:\"每一個公開的知識都被模型捕獲 , 但屬于我們或屬于公司的記憶不在互聯網上 , 因此不會被這些權重捕獲 。 需要設計系統來保存這些東西 。 \"
他說 , 前沿實驗室正在這方面開展工作 , 但根據他的定義 , 它們不是開源的 。
Fan 補充道:\"不僅如此 , 它們不支持彼此的模型 。 所以如果你使用特定的記憶系統 , 你就被綁定到特定的模型上 。 而我們今天開源的是一個記憶模型——我們相信記憶應該屬于擁有記憶的人 , 因此 , 通過開源它 , 這確保了信任和安全 , 無論你使用哪種模型 , 無論是開源還是閉源 , 這都會伴隨你 。 \"
利潤動機
在提出問題時 , Sigalos 這樣談論開源和閉源項目:
她指出:\"我和某人有過一次對話 , 他們說開源技術動力不足的部分原因是基于這樣一個事實:像你的企業客戶出于各種原因想要一個封閉系統 , 當你考慮 B2B 細分市場時 , 這可能更有利可圖 。 \"
Maheshwari 回應了這一點 , 再次指出一些所謂\"開源\"系統之間的差異 , 并建議實際上 , 操作系統是一個譜系 。
他說:\"模型的價值在于它們在應用中的使用 , 而應用是建立在經過微調的模型之上的 , 這些模型可能也被進一步'定制' , 擁有...一個開放權重模型 。 不要稱之為開源模型 。 即使是開放權重模型也允許在不同的基礎設施上托管 。 它允許人們使用它 。 這意味著他們可以'選擇'你可以使用的基礎設施成本 。 這允許改進 。 \"
二十一世紀的 AI 主權
Sigalos 問道:\"主權是國家安全和韌性的必要步驟 , 還是這是一個可能導致 AI 互聯網碎片化的陷阱?\"
Maheshwari 說:\"民眾正在陷入技術民族主義 。 不幸的是 , '由外而內'定義的民族自豪感對人們來說太誘人了 , 無法做到'由內而外'...主權是關于能夠控制社會未來的能力...人們需要能夠在當地環境中為社會利益部署 AI 。 我不相信主權必須以'分裂努力'的方式行使...如果做得周到 , 沒有理由我們不能讓社會、當地社會控制自己的命運 , 而不分裂努力 。 \"
Plehn 描述了美國 AI 行動計劃及其運作方式 , 以及他的公司所扮演的角色 。
他說:\"政策的一個關鍵組成部分實際上是開源 , 以及對它的推廣 , 當然是以美國優先的視角 , 但確實是開源 。 \"他透露他的公司 BrightQuery 正在致力于一個叫做國家安全數據服務的項目 。
他說:\"這是第一個集中式的美國政府數據生態系統 , 將為整個人口和機構以及整個世界提供服務 , 幫助告知公眾關于美國及其各種組成部分 。 \"
Plehn 也談到了反審查的斗爭 。
他說:\"抹除歷史事實 , 或修改歷史事實 , 是世界上一些政府和國家確實在做的事情 , 我相信我們都知道 。 因此美國反對這樣的政策 。 \"
Zhao 談到了他在希臘國家 AI 系統方面的工作 , 該系統由一家名為 Kiefer 的公司構建 , 我過去曾寫過這家公司 。
他說:\"讓他們這樣做的吸引力在于它是如此缺乏服務 。 對這些國家來說重要的是 , 特別是從語言角度來看 , 他們控制自己的命運 , 使用自己的語言、特定的文化 , 并確保模型代表這些 , 這對他們很重要 。 \"
Plehn 補充道:\"數據和知識沒有邊界 。 這確實是我們需要牢記的一個基本概念 。 一旦知識出來了 , 就出來了 , 很難遏制 , 除非當然 , 你有過度的審查 。 因此 , 盡管前沿 AI 公司可能會保護和包含他們發布和公布的底層模型和權重等 , 但對此的反駁是盡可能多地開源數據 。 \"
所有這些都強調了關于是否向公眾開放數據的真正辯論 。 隨著我們看到世界各地出現新模型 , 我們必須繼續思考這個問題 。
Q&A
Q1:什么是開源 AI 模型和閉源 AI 模型?它們有什么區別?
A:開源 AI 模型是指開發者公開發布模型的底層參數、訓練數據和權重輸入 , 允許用戶檢查、修改和操作 。 而閉源模型如GPT-4則保密這些信息 。 開源模型提供透明度和可審計性 , 但也可能面臨誤用風險 , 閉源模型則相對安全但缺乏透明度 。
Q2:為什么說美國在開源 AI 領域處于劣勢?
A:專家指出美國 AI 生態系統變得更加封閉 , 更多開源模型來自中國 , 而美國的前沿實驗室基本選擇閉源方法 。 這導致美國缺乏開源領導者 , 在全球 AI 開源競爭中處于相對劣勢地位 。
Q3:AI 主權對國家安全有什么重要意義?
A:AI 主權關乎國家控制自身 AI 未來發展的能力 , 讓國家能夠在本地環境中為社會利益部署 AI 。 它涉及使用本土語言和文化訓練模型 , 確保數據安全和技術自主 , 避免過度依賴外國 AI 系統 , 同時防止技術民族主義導致的過度分裂 。
【開源 AI 及其在當今世界中的重要作用】

    推薦閱讀