
文章圖片

文章圖片

文章圖片

文章圖片
說實話 , 五年前字節跳動官宣成立火山引擎時 , 我確實是屬于看不懂的那一個 。
在我印象里 , 當時云計算的牌桌上早已坐滿了阿里、騰訊、華為這些巨頭 , 戰局膠著 , 利潤微薄 。 字節跳動憑借抖音和頭條手握著巨大的流量和現金流 , 為什么要一頭扎進這片吃力不討好的紅海里?
這個問題 , 不僅是我 , 當時身邊的許多同行都感到困惑 。
然而 , 最近幾年 , 這個問題的答案開始變得異常清晰 。
尤其是在ChatGPT點燃了大模型的戰火之后 , 云計算市場被重新激活 , 阿里云、火山引擎、百度智能云紛紛加大投入 , 讓整個中國AI云市場的話語權爭奪變得日益激烈 , 這一點從國際數據公司IDC的多份調研報告中可以看出端倪 。
根據IDC 9月19日公布的報告 , 目前火山引擎在大模型公有云服務市?。 碝aaS市?。 ┪瘓庸詰諞?, 2025上半年市場份額49.2% , 儼然接近半壁江山 。
(圖源:火山引擎)
然而在日新月異的AI行業 , 這樣的優勢顯然不足以掉以輕心 。 10月16日 , 2025 火山引擎 FORCE LINK AI創新巡展 武漢站正式拉開帷幕 。 在這場與NVIDIA聯合舉辦的盛會上 , 火山引擎用一系列發布 , 詮釋了“模型升級創新驅動”的真諦 。
雷科技受邀參加此次巡展 , 想知道火山引擎要折騰些什么新東西嗎?跟著我來就行了 。
四大模型上新 , 成本進一步下降在火山引擎總裁譚待看來 , 目前全球AI大模型正在三個方向上快速發展:
一是深度思考模型正與多模態理解能力融合 , 二是視頻、圖像、語音模型逐步實現生產級水平 , 三是企業級復雜Agent正在走向成熟 , 為企業激發新的生產力潛能 。
(圖源:雷科技)
然而 , 在服務的過程中 , 火山引擎發現 , 開啟深度思考模式下 , 模型效果確實提升了 , 但也會提高模型延遲和使用成本 , 這導致實際應用中深度思考的使用占比僅有18% 。
針對這一痛點 , 豆包大模型1.6正式提供 Minimal、Low、Medium、High四種思考長度 , 平衡企業在不同場景下對模型效果、時延、成本的不同需求 , 并進一步提升了思考效率 , 這也讓豆包1.6成為國內首個原生支持“分檔調節思考長度”的模型 。
(圖源:雷科技)
不僅如此 , 為進一步滿足企業的多樣化需求 , 火山引擎正式推出豆包大模型1.6 lite , 號稱性能超越豆包大模型1.5 pro , 同時價格上 , 在使用量最大的0-32k輸入區間里 , 綜合使用成本較豆包1.5 pro降低53.3% , 推理速度更快、更具性價比 。
(圖源:雷科技)
只能說 , 價格控制這塊 , 火山引擎確實是行家中的行家 。
對了 , 在今天大會上 , 火山引擎正式發布豆包語音合成模型2.0、豆包聲音復刻模型2.0 , 它們都具備更強的情感表現力、更精準的指令遵循能力 。
最重要的是 , 還能準確朗讀復雜公式 。
(圖源:雷科技)
事實上 , 在教育場景中 , 復雜公式和符號的朗讀一直是業界難題 , 目前市面上的語音大模型朗讀準確率普遍低于50% , 而豆包新發布的兩大語音模型進行了針對性優化 , 目前在小學至高中階段全學科的復雜公式朗讀中 , 準確率可達90% 。
聽著蠟筆小新抑揚頓挫地讀出這樣一段復雜且冗長的化學公式時 , 我承認 , 我真的偷笑了 。
全新的語音模型還能搭配圖像模型來使用 , 快速創造出各種有聲繪本 , 對即夢未來的發展也會有所加持 。
正所謂 , 要“有好模型” , 才能“做好應用” 。
在小雷看來 , 好應用的底層必須由好模型來支持 。 而一個好模型 , 既要能精準捕捉用戶需求 , 又得具備穩定的響應能力 , 更要做到出色的成本控制 。
這樣 , 才能讓用戶感受到“用得順、靠得住、敢去用” 。
智能路由加持 , 應用開發更省心現在有了“好模型” , 那么問題自然落到了如何“做好應用”上 。
在很多企業看來 , 如今市面上的模型越來越多 , 哪怕只看豆包大模型家族 , 也有不下十來款產品 。 面對具體需求時 , 如何選擇模型最有性價比?
為了解決這個問題 , 火山引擎在今天正式發布智能模型路由(Smart Model Router) , 這也是國內AI云行業首個針對模型智能選擇的解決方案 。
(圖源:雷科技)
這玩意的功能很好理解 , 就是能夠根據用戶的實際需求自動選擇不同的模型運行任務 。
用戶可以在火山方舟上選擇“智能模型路由”功能 , 從“平衡模式”、“效果優先模式”和“成本優先模式”三種方案進行選擇 , 智能路由會針對任務請求自動選擇最合適的模型 , 達到效果與成本的最優解 。
在會后進行的群訪中 , 譚待表示 , 在部分場景中 , 小模型效果其實是優于大模型的(如簡單客服問題用Flash模型 , 復雜問題用大尺寸模型) 。 開啟智能路由后 , 無論是效果還是成本 , 都會比直接使用對應模型得到顯著優化 , 他們希望借此降低企業技術門檻 , 實現“效果+成本雙優” 。
【4款豆包大模型上新!成本銳減,火山引擎進入AI落地深水區】另一個比較有趣的更新 , 則是VideoPilot工具 。
(圖源:雷科技)
借助這個工具 , 你可以深入理解參考視頻 , 自動生成對應的Prompt , 讓你更方便地進行視頻創作 , 甚至還能支持語言反饋 , 在原視頻基礎上實現多輪交互式優化 。
當然了 , 這種逆推Prompt的方式 , 在AI玩家里早已不是什么秘密 。
就拿我自己為例吧 , 可能是因為用多了的原因 , 我現在養成了看到場景、鏡頭、拍攝手法獨特的寫真都保存一下的習慣 , 需要創作時只要一句簡單的:
“分析可用于生成這種圖片的連貫prompt , 忽略角色本身外觀/穿著特征 , 注重畫面構成、角色動作、環境描寫和鏡頭角度 , 最多200字 。 ”
如此一來 , 豆包就能自動生成用于制作同類型圖片的Prompt , 而VideoPilot則是把這種能力擴充到了視頻上 , 讓用戶可以快速、精準地完成對既有內容/目標內容的模仿和擴展 。
對于視頻生成而言 , 擁有這樣的功能確實是省心省力不少 。
在今天上午的群訪最后 , 譚待也表達了這樣一個觀點:生成類模型(生圖、生視頻)將會成為短期增長的核心趨勢之一 , 而展望未來的話 , Coding領域有望爆發 。
歸根結底 , 還是當前國內受模型能力限制尚未完全釋放 , 未來潛力較大 。
總結從會場出來 , 武漢的風吹在臉上 , 我腦子里亂糟糟的 , 但又有一條線索越來越清晰 。
今天的發布會 , 表面上看是發了新模型、新工具 , 但骨子里 , 我感覺字節跳動或者說火山引擎 , 其實是在簡化著AI時代的“游戲規則” 。
(圖源:雷科技)
過去 , 大家比的是誰的“大腦”更聰明 , 參數更多 , 跑分更高 , 是一場軍備競賽 。 但火山引擎今天似乎在說:光有大腦沒用 , 能動手、會干活、聽指揮 , 還不貴 , 能踏踏實實地去為企業創造價值 , 這才是王道 。
正如巡展的“城市計劃”所展示的 , 從廈門的持續運營方案 , 到武漢的智能路由進化 , 火山引擎正一步一個腳印 , 將其在字節跳動內部海量業務中錘煉出的AI能力 , 系統性地開放給千行百業 。
在AI浪潮席卷全球的今天 , 許多企業依然在“如何用上AI”的門前徘徊 。
現如今 , 在模型全面升級、技術門檻有效降低的情況下 , 為了加強市場的競爭力 , 企業將更勇敢地邁出轉型的步伐 , 加速推進AI能力和自家業務的融合 。
當大模型真正成為企業生產力的一部分 , 一場真正的效率革命 , 才算剛剛開始 。
推薦閱讀
- 大模型追逐星辰大海,GPT和Gemini國際天文奧賽奪金
- 谷歌開源全棧平臺Coral NPU,能讓大模型在手表上全天候運行
- 閃電快訊|科大訊飛同傳大模型再升級,上海、迪拜雙城發布訊飛AI翻譯耳機
- 北大彭一杰教授課題組提出RiskPO,風險度量優化重塑大模型后訓練
- vivo智能助手“藍心小V”再升級,豆包大模型讓AI原生體驗拉滿
- 科大訊飛同傳大模型再升級:上海、迪拜同發訊飛AI翻譯耳機
- 真正的AI競爭力,藏在大模型“后訓練”這一步
- 投資人查馬斯:公司已在使用中國開源大模型
- 超越ZIP的無損壓縮來了,華盛頓大學讓大模型成為無損文本壓縮器
- 雙十一大跳水,4款驍龍8Gen 3手機怎么選?
