SuperCLUE多模態視覺評測榜出爐:文心4.5 Turbo并列國內第一!

SuperCLUE多模態視覺評測榜出爐:文心4.5 Turbo并列國內第一!

文章圖片

SuperCLUE多模態視覺評測榜出爐:文心4.5 Turbo并列國內第一!

快科技8月28日消息 , 中文多模態視覺語言模型測評基準(SuperCLUE-VLM)8月榜單正式發布 , 百度ERNIE-4.5-Turbo-VL多模態大模型以 66.47分 的成績并列位居國內模型第一 , 在真實場景任務下的領先優勢明顯 。
本次評估覆蓋Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5(high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest等國內外15款多模態模型 。

基于中文場景特點 , SuperCLUE-VLM圍繞基礎認知、視覺推理和視覺應用三大核心維度進行評測 , 全面考察模型在真實任務場景下的能力 。
測評結果顯示 , Gemini-2.5-Pro 以總分74.99分領先 , OpenAI GPT-5(high) 以總分68.59分位居第二 , 百度ERNIE-4.5-Turbo-VL-32k-preview 以總分66.47分并列國內模型第一 。

有分析人士點評 , 文心大模型在多模態領域的多維度領先優勢十分突出 。 ERNIE-4.5-Turbo-VL等國內其他頭部模型在視覺推理、視覺應用等高階任務上的顯著進步 , 凸顯了中國在多模態大模型領域的競爭潛力 。
據悉 , 6月30日百度開源文心4.5系列10款模型 , 其中 ERNIE-4.5-VL視覺語言模型具備復雜的圖文與視頻理解能力 , 支持超過100種語言交互 , 其跨模態能力覆蓋文檔處理、視頻管理、學習解題等核心任務場景 。

作為國內最早投入大模型產研的企業 , 百度依托“芯片-框架-模型-應用”的全棧自研體系 , 持續推動文心大模型能力進化 。
得益于飛槳文心的聯合優化 , 文心大模型的能力拓展和效率提升 。
【SuperCLUE多模態視覺評測榜出爐:文心4.5 Turbo并列國內第一!】截至目前 , 飛槳文心開發者數量已超過2185萬 , 服務超過67萬家企業 , 創建的模型達到110萬 。

    推薦閱讀