Anthropic發布入門級Claude Haiku 4.5混合推理模型

Anthropic發布入門級Claude Haiku 4.5混合推理模型

Anthropic PBC今日發布了Claude Haiku 4.5大語言模型 , 專門面向成本敏感的應用場景 。
該公司對該模型的收費標準為每百萬輸入Token 1美元 , 每百萬輸出Token 5美元 。 相比之下 , Anthropic的旗艦大語言模型Claude Sonnet 4.5的收費是其三倍 。
Haiku 4.5是一個混合推理模型 , 這意味著它可以根據請求調整所使用的計算資源 。 默認情況下 , 該算法通過需要有限硬件資源的工作流程生成響應 。 用戶可以啟用\"擴展思考\"模式 , 讓Haiku 4.5產生更復雜的響應 , 但生成時間會更長 。
【Anthropic發布入門級Claude Haiku 4.5混合推理模型】Anthropic使用公開網頁、第三方數據提供商的內容以及內部記錄來訓練這個大語言模型 。 后者包括那些授權公司將其數據用于AI訓練的Claude客戶的信息 。 Anthropic從數據集中刪除了重復條目以提高訓練效率 。
據該公司介紹 , Haiku 4.5可以處理包含多達20萬Token信息的多模態提示 。 這使其能夠處理大型文件 , 如冗長的商業文檔 。 該模型每次響應最多輸出64000個Token 。
Anthropic使用八個流行的基準測試來評估Haiku 4.5的能力 。 在大多數測試中 , 該大語言模型的表現僅比Anthropic旗艦模型Sonnet 4.5落后不到10% 。 在包含編程任務和高中數學問題的三個基準測試中 , 它的表現超過了該公司之前的旗艦大語言模型Sonnet 4 。
提高成本效率并非Haiku 4.5的唯一賣點 。 Anthropic將其描述為該公司工程師迄今為止開發的最安全的大語言模型 。 此外 , 該算法的速度是Sonnet 4的兩倍多 , 這使其適用于對延遲敏感的應用 , 如客戶支持聊天機器人 。
Haiku 4.5也適合智能體項目 。 據Anthropic介紹 , 基于其旗艦Sonnet 4.5模型的智能體可以通過將簡單任務委托給Haiku 4.5子智能體來降低推理成本 。 這樣的工作流程可用于自動化多步驟編程和市場研究任務 。
新模型通過應用程序編程接口和Anthropic的Claude聊天機器人提供服務 。 它還包含在Claude Code中 , 自5月推出以來 , 該產品已成為公司的主要增長動力 。 路透社今日援引消息人士的話稱 , 這款編程助手的年度經常性收入正接近10億美元 。
與Anthropic類似 , OpenAI也提供其旗艦大語言模型的精簡版本 。 GPT-5 Mini和GPT-5 Nano的推理能力比其同名產品更有限 , 但成本顯著降低 。 OpenAI和Anthropic都允許開發者緩存頻繁出現的提示響應 , 通過消除多次從頭生成相同輸出的需要來降低推理成本 。
Q&A
Q1:Claude Haiku 4.5相比其他模型有什么優勢?
A:Claude Haiku 4.5主要優勢包括成本效率高(收費僅為旗艦模型的三分之一)、處理速度快(比Sonnet 4快兩倍多)、安全性強(被稱為Anthropic最安全的模型) 。 它是混合推理模型 , 可根據需求調整計算資源 , 支持多模態處理 , 能處理20萬Token的大型文檔 。
Q2:什么是混合推理模型?它如何工作?
A:混合推理模型是指可以根據請求調整計算資源使用量的模型 。 Claude Haiku 4.5默認通過需要有限硬件資源的工作流程生成響應 , 但用戶可以啟用\"擴展思考\"模式來獲得更復雜的響應 , 雖然生成時間會更長 。 這種設計讓用戶可以在成本和性能之間靈活平衡 。
Q3:Claude Haiku 4.5在智能體應用中有什么作用?
A:Claude Haiku 4.5非常適合智能體項目應用 。 基于旗艦Sonnet 4.5模型的智能體可以將簡單任務委托給Haiku 4.5子智能體處理 , 從而降低推理成本 。 這種工作流程特別適用于自動化多步驟編程和市場研究等復雜任務 , 實現成本優化的同時保持效率 。


    推薦閱讀