Anthropic新模型宣傳稿泄露,代號卡皮巴拉,稱網絡安全能力領先

Anthropic新模型宣傳稿泄露,代號卡皮巴拉,稱網絡安全能力領先

文章圖片


幾天前 , 一家網絡安全公司的研究員 Roy Paz 像往常一樣在網上掃描公開數據時 , 發現了一個原本不該被看到的東西:Anthropic 的內容管理系統里有一個文件夾被設置成了公開訪問 , 里面有將近 3000 個尚未發布的文件 , 其中包括一篇寫好的博客草稿 , 草稿的主角是一個叫做 Claude Mythos 的新模型 , 以及一個全新的產品層級 Capybara 。

產品層級是指 Anthropic 將其 AI 模型按照能力、速度和價格劃分的不同版本 , 目前已有的三個層級:分別是最快最便宜的 Haiku、中等的 Sonnet 和最大最強大的 Opus , 而新泄露的 Capybara 將是比 Opus 更高一級的新層級 。


【Anthropic新模型宣傳稿泄露,代號卡皮巴拉,稱網絡安全能力領先】(來源:Anthropic)

Capybara 是水豚 , 國內常常叫做卡皮巴拉 , 它是世界上最大的嚙齒動物 , 性格較為溫吞 。 Anthropic 給新模型起這個名字 , 顯然不是圖它可愛 。


圖 | 水豚(來源:維基百科)

根據泄露的博客草稿 , Capybara 更大、更聰明、也更貴 。 它在軟件編程、學術推理和網絡安全相關的測試中 , 得分大幅超過 Claude Opus 4.6 。 博客草稿里甚至使用了“這是迄今為止我們開發過的最強大的 AI 模型”這樣的措辭 。

Anthropic 的發言人隨后向財經媒體 Fortune 確認了這件事 。 他們承認模型確實存在 , 并表示目前正在訓練中 , 已經開始給一小批早期客戶測試 。 發言人還說 , 這個模型代表了 AI 性能的一次階躍式變化 , 是他們截至目前造出的最強大的產品 , 泄露的原因被歸結為內容管理系統配置時的人為失誤 。

博客草稿里有這樣一段帶有提醒意味的話 , 那就是這個模型“在網絡安全能力上遠遠領先于其他任何 AI 模型” , 這種新模型預示著接下來會出現這樣一批 AI , 這批 AI 在發現和利用安全漏洞上的速度 , 會比防御方修復漏洞的速度快得多 。 換句話說 , 黑客利用這類 AI 來尋找網絡漏洞的速度 , 會遠遠跑在安全工程師前面 。

所以 Anthropic 很擔心黑客會利用這個模型發動大規模網絡攻擊 。 因此 , 他們此次采用了這樣的發布策略 , 先開放給組織做早期測試 , 讓防御方提前做好準備 , 以便應對即將帶來的 AI 驅動漏洞共計浪潮 。

消息傳開之后的周五 , 網絡安全股集體跳水 。 Cloudflare、CrowdStrike、Palo Alto Networks 等網絡安全公司股價紛紛下跌 。

人們主要擔心的兩件事 , 一是擔心 Anthropic 自己下場做安全工具會搶生意 , 二是這個模型落到黑客手里會釀成災難 。 不過 , 華爾街分析師很快出來滅火 , 說市場誤讀了這條新聞 , 還說如果 AI 真的構成了安全威脅那就更應該買入最強的網絡安全公司來擋一擋 。

然而 , Anthropic 對于安全問題的警惕不是空穴來風 。 今年早些時候 , 一個黑客利用 Anthropic 的 AI 模型針對墨西哥政府發起了一系列攻擊 , 竊取了敏感的稅務信息和選民信息 。 Anthropic 后來調查并封掉了相關賬號 。

上個月 , Anthropic 還發布了一個叫做 Claude Code Security 的工具 , 專門幫助開發者掃描代碼庫里的安全漏洞 。 Anthropic 自己的工程師也使用 Opus 4.6 在開源項目里找到了 500 多個高危漏洞 , 有一次甚至通過分析變更日志里的一條開發者注釋 , 推斷出 PDF 工具里藏著一個漏洞 。

說回這次博客草稿的泄露 , 草稿還意外曝光了一場即將在英國舉行的 CEO 閉門峰會 , 這個為期兩天的聚會將在英格蘭鄉村一座 18 世紀莊園改建的酒店里舉行 , 屆時將邀請歐洲最有影響力的商界領袖 , 也會有立法者和政策制定者來講解企業 AI 使用建議 , 與會者還能提前體驗未發布的 Claude 新能力 。 Anthropic 確認這個活動確實存在 , 并表示是他們過去一年的系列活動的延續 。

此次博客草稿泄露的幾天前 , OpenAI 剛被曝完成了一個內部代號為 Spud 的新模型的預訓練 , 預計幾周內發布 。 兩家美國頭部 AI 公司的新模型幾乎同時浮出水面 , 并且都指向同一個方向:更強的推理能力、更強的代碼能力以及更強的網絡安全雙刃劍屬性 。

只不過 Anthropic 選擇了更謹慎的路線 , 先給早期客戶測試 , 先讓防御方做好準備 , 這也和 Anthropic 及其創始人達里奧重視安全的作風一脈相承 。

不知道 Anthropic 是否有意給新模型起了水豚這樣一個的名字 , 水豚雖然性格平和 , 天生不具備攻擊性 , 但在某些情況下也會出于自衛而咬人 。 不過可以肯定的是 , Anthropic 也是在提醒大家面對 AI 安全千萬不可大意 。

參考資料:
https://fortune.com/2026/03/26/anthropic-says-testing-mythos-powerful-new-ai-model-after-data-leak-reveals-its-existence-step-change-in-capabilities/
https://siliconangle.com/2026/03/27/anthropic-launch-new-claude-mythos-model-advanced-reasoning-features/
https://www.marketwatch.com/story/palo-alto-networks-and-other-cybersecurity-stocks-slide-on-fresh-anthropic-fears-investors-may-be-overreacting-e0624b0b
https://www.bloomberg.com/news/articles/2026-03-27/cyber-stocks-sink-on-report-anthropic-model-poses-security-risks
https://www.livemint.com/technology/tech-news/meet-claude-mythos-anthropic-accidentally-leaks-unreleased-ai-model-with-severe-cybersecurity-risks-11774601003808.html
https://zh.wikipedia.org/wiki/%E6%B0%B4%E8%B1%9A#/media/File:Cattle_tyrant_(Machetornis_rixosa)_on_Capybara.jpg

排版:胡巍巍

    推薦閱讀