Anthropic新模型宣傳稿泄露，代號卡皮巴拉，稱網絡安全能力領先

2026-04-19 ai 網絡安全互聯網黑客 anthropic

文章圖片

幾天前，一家網絡安全公司的研究員 Roy Paz 像往常一樣在網上掃描公開數據時，發現了一個原本不該被看到的東西：Anthropic 的內容管理系統里有一個文件夾被設置成了公開訪問，里面有將近 3000 個尚未發布的文件，其中包括一篇寫好的博客草稿，草稿的主角是一個叫做 Claude Mythos 的新模型，以及一個全新的產品層級 Capybara 。

產品層級是指 Anthropic 將其 AI 模型按照能力、速度和價格劃分的不同版本，目前已有的三個層級：分別是最快最便宜的 Haiku、中等的 Sonnet 和最大最強大的 Opus ，而新泄露的 Capybara 將是比 Opus 更高一級的新層級。

【Anthropic新模型宣傳稿泄露，代號卡皮巴拉，稱網絡安全能力領先】（來源：Anthropic）

Capybara 是水豚，國內常常叫做卡皮巴拉，它是世界上最大的嚙齒動物，性格較為溫吞。 Anthropic 給新模型起這個名字，顯然不是圖它可愛。

圖 | 水豚（來源：維基百科）

根據泄露的博客草稿， Capybara 更大、更聰明、也更貴。它在軟件編程、學術推理和網絡安全相關的測試中，得分大幅超過 Claude Opus 4.6 。博客草稿里甚至使用了“這是迄今為止我們開發過的最強大的 AI 模型”這樣的措辭。

Anthropic 的發言人隨后向財經媒體 Fortune 確認了這件事。他們承認模型確實存在，并表示目前正在訓練中，已經開始給一小批早期客戶測試。發言人還說，這個模型代表了 AI 性能的一次階躍式變化，是他們截至目前造出的最強大的產品，泄露的原因被歸結為內容管理系統配置時的人為失誤。

博客草稿里有這樣一段帶有提醒意味的話，那就是這個模型“在網絡安全能力上遠遠領先于其他任何 AI 模型” ，這種新模型預示著接下來會出現這樣一批 AI ，這批 AI 在發現和利用安全漏洞上的速度，會比防御方修復漏洞的速度快得多。換句話說，黑客利用這類 AI 來尋找網絡漏洞的速度，會遠遠跑在安全工程師前面。

所以 Anthropic 很擔心黑客會利用這個模型發動大規模網絡攻擊。因此，他們此次采用了這樣的發布策略，先開放給組織做早期測試，讓防御方提前做好準備，以便應對即將帶來的 AI 驅動漏洞共計浪潮。

消息傳開之后的周五，網絡安全股集體跳水。 Cloudflare、CrowdStrike、Palo Alto Networks 等網絡安全公司股價紛紛下跌。

人們主要擔心的兩件事，一是擔心 Anthropic 自己下場做安全工具會搶生意，二是這個模型落到黑客手里會釀成災難。不過，華爾街分析師很快出來滅火，說市場誤讀了這條新聞，還說如果 AI 真的構成了安全威脅那就更應該買入最強的網絡安全公司來擋一擋。

然而， Anthropic 對于安全問題的警惕不是空穴來風。今年早些時候，一個黑客利用 Anthropic 的 AI 模型針對墨西哥政府發起了一系列攻擊，竊取了敏感的稅務信息和選民信息。 Anthropic 后來調查并封掉了相關賬號。

上個月， Anthropic 還發布了一個叫做 Claude Code Security 的工具，專門幫助開發者掃描代碼庫里的安全漏洞。 Anthropic 自己的工程師也使用 Opus 4.6 在開源項目里找到了 500 多個高危漏洞，有一次甚至通過分析變更日志里的一條開發者注釋，推斷出 PDF 工具里藏著一個漏洞。

說回這次博客草稿的泄露，草稿還意外曝光了一場即將在英國舉行的 CEO 閉門峰會，這個為期兩天的聚會將在英格蘭鄉村一座 18 世紀莊園改建的酒店里舉行，屆時將邀請歐洲最有影響力的商界領袖，也會有立法者和政策制定者來講解企業 AI 使用建議，與會者還能提前體驗未發布的 Claude 新能力。 Anthropic 確認這個活動確實存在，并表示是他們過去一年的系列活動的延續。

此次博客草稿泄露的幾天前， OpenAI 剛被曝完成了一個內部代號為 Spud 的新模型的預訓練，預計幾周內發布。兩家美國頭部 AI 公司的新模型幾乎同時浮出水面，并且都指向同一個方向：更強的推理能力、更強的代碼能力以及更強的網絡安全雙刃劍屬性。

只不過 Anthropic 選擇了更謹慎的路線，先給早期客戶測試，先讓防御方做好準備，這也和 Anthropic 及其創始人達里奧重視安全的作風一脈相承。

不知道 Anthropic 是否有意給新模型起了水豚這樣一個的名字，水豚雖然性格平和，天生不具備攻擊性，但在某些情況下也會出于自衛而咬人。不過可以肯定的是， Anthropic 也是在提醒大家面對 AI 安全千萬不可大意。

參考資料：
https://fortune.com/2026/03/26/anthropic-says-testing-mythos-powerful-new-ai-model-after-data-leak-reveals-its-existence-step-change-in-capabilities/
https://siliconangle.com/2026/03/27/anthropic-launch-new-claude-mythos-model-advanced-reasoning-features/
https://www.marketwatch.com/story/palo-alto-networks-and-other-cybersecurity-stocks-slide-on-fresh-anthropic-fears-investors-may-be-overreacting-e0624b0b
https://www.bloomberg.com/news/articles/2026-03-27/cyber-stocks-sink-on-report-anthropic-model-poses-security-risks
https://www.livemint.com/technology/tech-news/meet-claude-mythos-anthropic-accidentally-leaks-unreleased-ai-model-with-severe-cybersecurity-risks-11774601003808.html
https://zh.wikipedia.org/wiki/%E6%B0%B4%E8%B1%9A#/media/File:Cattle_tyrant_(Machetornis_rixosa)_on_Capybara.jpg

排版：胡巍巍

推薦閱讀

上一篇：華為吳輝：擁抱AI大增量時代 “伙伴+華為”體系走向共享融合

下一篇：楊植麟、張鵬、羅福莉等齊聚一堂，他們關于OpenClaw的觀點值得一聽。