4款豆包大模型上新！成本銳減，火山引擎進入AI落地深水區_ai|智能路由|字節跳動|人工智

文章圖片

文章圖片

文章圖片

文章圖片

說實話，五年前字節跳動官宣成立火山引擎時，我確實是屬于看不懂的那一個。
在我印象里，當時云計算的牌桌上早已坐滿了阿里、騰訊、華為這些巨頭，戰局膠著，利潤微薄。字節跳動憑借抖音和頭條手握著巨大的流量和現金流，為什么要一頭扎進這片吃力不討好的紅海里？
這個問題，不僅是我，當時身邊的許多同行都感到困惑。
然而，最近幾年，這個問題的答案開始變得異常清晰。
尤其是在ChatGPT點燃了大模型的戰火之后，云計算市場被重新激活，阿里云、火山引擎、百度智能云紛紛加大投入，讓整個中國AI云市場的話語權爭奪變得日益激烈，這一點從國際數據公司IDC的多份調研報告中可以看出端倪。
根據IDC 9月19日公布的報告，目前火山引擎在大模型公有云服務市?。 碝aaS市?。 ┪瘓庸詰諞?， 2025上半年市場份額49.2% ，儼然接近半壁江山。

（圖源：火山引擎）
然而在日新月異的AI行業，這樣的優勢顯然不足以掉以輕心。 10月16日， 2025 火山引擎 FORCE LINK AI創新巡展武漢站正式拉開帷幕。在這場與NVIDIA聯合舉辦的盛會上，火山引擎用一系列發布，詮釋了“模型升級創新驅動”的真諦。
雷科技受邀參加此次巡展，想知道火山引擎要折騰些什么新東西嗎？跟著我來就行了。
四大模型上新，成本進一步下降在火山引擎總裁譚待看來，目前全球AI大模型正在三個方向上快速發展：
一是深度思考模型正與多模態理解能力融合，二是視頻、圖像、語音模型逐步實現生產級水平，三是企業級復雜Agent正在走向成熟，為企業激發新的生產力潛能。

（圖源：雷科技）
然而，在服務的過程中，火山引擎發現，開啟深度思考模式下，模型效果確實提升了，但也會提高模型延遲和使用成本，這導致實際應用中深度思考的使用占比僅有18% 。
針對這一痛點，豆包大模型1.6正式提供 Minimal、Low、Medium、High四種思考長度，平衡企業在不同場景下對模型效果、時延、成本的不同需求，并進一步提升了思考效率，這也讓豆包1.6成為國內首個原生支持“分檔調節思考長度”的模型。

（圖源：雷科技）
不僅如此，為進一步滿足企業的多樣化需求，火山引擎正式推出豆包大模型1.6 lite ，號稱性能超越豆包大模型1.5 pro ，同時價格上，在使用量最大的0-32k輸入區間里，綜合使用成本較豆包1.5 pro降低53.3% ，推理速度更快、更具性價比。

（圖源：雷科技）
只能說，價格控制這塊，火山引擎確實是行家中的行家。
對了，在今天大會上，火山引擎正式發布豆包語音合成模型2.0、豆包聲音復刻模型2.0 ，它們都具備更強的情感表現力、更精準的指令遵循能力。
最重要的是，還能準確朗讀復雜公式。

（圖源：雷科技）
事實上，在教育場景中，復雜公式和符號的朗讀一直是業界難題，目前市面上的語音大模型朗讀準確率普遍低于50% ，而豆包新發布的兩大語音模型進行了針對性優化，目前在小學至高中階段全學科的復雜公式朗讀中，準確率可達90% 。
聽著蠟筆小新抑揚頓挫地讀出這樣一段復雜且冗長的化學公式時，我承認，我真的偷笑了。
全新的語音模型還能搭配圖像模型來使用，快速創造出各種有聲繪本，對即夢未來的發展也會有所加持。
正所謂，要“有好模型” ，才能“做好應用” 。
在小雷看來，好應用的底層必須由好模型來支持。而一個好模型，既要能精準捕捉用戶需求，又得具備穩定的響應能力，更要做到出色的成本控制。
這樣，才能讓用戶感受到“用得順、靠得住、敢去用” 。
智能路由加持，應用開發更省心現在有了“好模型” ，那么問題自然落到了如何“做好應用”上。
在很多企業看來，如今市面上的模型越來越多，哪怕只看豆包大模型家族，也有不下十來款產品。面對具體需求時，如何選擇模型最有性價比？
為了解決這個問題，火山引擎在今天正式發布智能模型路由（Smart Model Router），這也是國內AI云行業首個針對模型智能選擇的解決方案。

（圖源：雷科技）
這玩意的功能很好理解，就是能夠根據用戶的實際需求自動選擇不同的模型運行任務。
用戶可以在火山方舟上選擇“智能模型路由”功能，從“平衡模式”、“效果優先模式”和“成本優先模式”三種方案進行選擇，智能路由會針對任務請求自動選擇最合適的模型，達到效果與成本的最優解。
在會后進行的群訪中，譚待表示，在部分場景中，小模型效果其實是優于大模型的（如簡單客服問題用Flash模型，復雜問題用大尺寸模型）。開啟智能路由后，無論是效果還是成本，都會比直接使用對應模型得到顯著優化，他們希望借此降低企業技術門檻，實現“效果+成本雙優” 。
【4款豆包大模型上新！成本銳減，火山引擎進入AI落地深水區】另一個比較有趣的更新，則是VideoPilot工具。

（圖源：雷科技）
借助這個工具，你可以深入理解參考視頻，自動生成對應的Prompt ，讓你更方便地進行視頻創作，甚至還能支持語言反饋，在原視頻基礎上實現多輪交互式優化。
當然了，這種逆推Prompt的方式，在AI玩家里早已不是什么秘密。
就拿我自己為例吧，可能是因為用多了的原因，我現在養成了看到場景、鏡頭、拍攝手法獨特的寫真都保存一下的習慣，需要創作時只要一句簡單的：
“分析可用于生成這種圖片的連貫prompt ，忽略角色本身外觀/穿著特征，注重畫面構成、角色動作、環境描寫和鏡頭角度，最多200字。 ”
如此一來，豆包就能自動生成用于制作同類型圖片的Prompt ，而VideoPilot則是把這種能力擴充到了視頻上，讓用戶可以快速、精準地完成對既有內容/目標內容的模仿和擴展。
對于視頻生成而言，擁有這樣的功能確實是省心省力不少。
在今天上午的群訪最后，譚待也表達了這樣一個觀點：生成類模型（生圖、生視頻）將會成為短期增長的核心趨勢之一，而展望未來的話， Coding領域有望爆發。
歸根結底，還是當前國內受模型能力限制尚未完全釋放，未來潛力較大。
總結從會場出來，武漢的風吹在臉上，我腦子里亂糟糟的，但又有一條線索越來越清晰。
今天的發布會，表面上看是發了新模型、新工具，但骨子里，我感覺字節跳動或者說火山引擎，其實是在簡化著AI時代的“游戲規則” 。

（圖源：雷科技）
過去，大家比的是誰的“大腦”更聰明，參數更多，跑分更高，是一場軍備競賽。但火山引擎今天似乎在說：光有大腦沒用，能動手、會干活、聽指揮，還不貴，能踏踏實實地去為企業創造價值，這才是王道。
正如巡展的“城市計劃”所展示的，從廈門的持續運營方案，到武漢的智能路由進化，火山引擎正一步一個腳印，將其在字節跳動內部海量業務中錘煉出的AI能力，系統性地開放給千行百業。
在AI浪潮席卷全球的今天，許多企業依然在“如何用上AI”的門前徘徊。
現如今，在模型全面升級、技術門檻有效降低的情況下，為了加強市場的競爭力，企業將更勇敢地邁出轉型的步伐，加速推進AI能力和自家業務的融合。
當大模型真正成為企業生產力的一部分，一場真正的效率革命，才算剛剛開始。