谷歌發布Gemini 3 Flash,口述即原型,速度堪比搜索引擎

谷歌發布Gemini 3 Flash,口述即原型,速度堪比搜索引擎

文章圖片

谷歌發布Gemini 3 Flash,口述即原型,速度堪比搜索引擎

谷歌和 OpenAI 徹底殺瘋了 , 在 OpenAI 發布圖像模型的一天后 , 當地時間 12 月 17 日谷歌正式發布 Gemini 3 Flash , 其宣傳語是“以極低的成本 , 實現速度極快的尖端智能” 。

3 Flash 讓極速智能進入了主力機時代 , 實現了 3 倍提速和成本驟降 , 零代碼也能造應用 , 開啟了氛圍編程 , 實現了口述即原型 。 谷歌官方稱其速度堪比搜索引擎 , 它在保持 Pro 級智商的同時 , 將 tokens 消耗降低了 30% , 旨在重塑大模型性價比天花板 。


(來源:資料圖)

在此時發布這樣一個快速且價格低廉的 3 Flash , 或許意圖搶占 OpenAI 的圖像模型的風頭 。 而在基準測試中 , 3 Flash 大幅超越了其前代產品 , 并在某些方面與 Gemini 3 Pro 和 GPT 5.2 等其他前沿模型不相上下 。

谷歌表示 , 3 Flash 擁有前沿智能 , 專為速度而生 , 可以幫助用戶更快地學習、構建和規劃任何事物 。 它可以很好地識別多模態內容 , 并據此給出答案 。

例如 , 可以上傳一段匹克球短視頻并尋求技巧指導;也可以嘗試繪制一幅素描畫 , 讓模型猜猜你畫的是什么;或者可以上傳一段錄音以便獲得分析結果或者生成測驗 。 該模型可以更好地理解用戶查詢的意圖 , 并能生成包含圖像和表格等元素在內的更具視覺沖擊力的答案 。

其氛圍編程能力具體指的是 , 無需任何編程知識 , 就能用語音快速構建應用程序 。 只需對著 Gemini 進行口述 , 就能在幾分鐘內將零散想法轉化為一個功能齊全的應用程序 。

即使你沒有任何編程基礎 , 也能快速從零開始構建應用程序 , 只需讓 Gemini 幫助迭代你的想法即可 。 用戶可以隨時隨地口述自己的靈感 , 并將其轉化為原型 。

3 Flash 的 AI 模式能夠更有效地解析問題的細微差別 。 它會考慮用戶問題的每一個方面 , 并提供更全面、更易于理解的答案 , 比如它會從全網提取實時本地信息和實用鏈接 。 最終 , 它能讓用戶獲得一份條理清晰的分析報告和具體建議 。

3 Flash 保留了 Gemini 3 的復雜推理、多模態/視覺理解以及在智能體/氛圍編程任務中的出色性能 。 3 Flash 在各方面都超越了 2.5 Flash , 并且在多項基準測試中顯著優于 2.5 Pro 。 3 Flash 也與 3 Pro 性能相當 , 在 MMMU Pro、Toolathlon 和 MPC Atlas 等方面更勝一籌 。


(來源:資料圖)

在 GPQA 鉆石級(科學知識)上其準確率達到 90.4% , 在人類最后的考試(學術推理)上其在不使用工具時的得分為 33.7% , 在 MMMU Pro(多模態理解和多模態推理上)其達到 81.2% 的正確率 , 在 SWE-Bench 驗證(代碼理解)上其達到 78% 的正確率 , 在工具競賽(長期真實世界軟件任務)上其達到 49.4% 的正確率 , 在 MCP Atlas(使用 MCP 的多步驟工作流程)上其達到 57.4% 的準確率 。


(來源:資料圖)

谷歌宣稱 , Flash 3 的性能比 2.5 Pro 快 3 倍 , 成本卻低得多 。 并表示這種強大的產品邏輯、工具使用和多模態功能 , 可以為構建客戶支持代理或游戲內助手的第三方開發者帶來更復雜的視頻分析、數據提取和視覺問答功能 。

其定價為每百萬個輸入 tokens 0.5 美元 , 每百萬個輸出 tokens 3 美元 , 音頻輸入仍為每百萬個輸入 tokens 1 美元 。

但是谷歌聲稱 , 新模型的性能優于 Gemini 2.5 Pro , 速度也是后者的三倍 。 而且 , 在處理思維任務的時候 , 它平均比 2.5 Pro 少用 30% 的 tokens 。 這意味著 , 在某些任務中有望帶來 tokens 的節約 。

Gemini 大模型高級總監兼產品負責人圖爾西·多希(Tulsee Doshi)告訴媒體:“我們真正地將 Flash 定位為更加偏向主力機型的模型 。 如果看一下輸入價格和輸出價格 , 就會發現 Flash 要便宜得多 。 因此 , 它可以幫助許多公司完成批量性的任務 。 ”

3 Flash 現在已經在 Gemini 應用中推出 , 并將取代 2.5 Flash 成為默認模型 。 值得注意的是 , 3 Flash 將在型號選擇中提供兩種選項:第一種是快速選項用于快速解答問題;第二種是思考選項用于解決復雜問題 。 它也允許用戶提出更細致的問題 。

谷歌指出 , JetBrains、Figma、Cursor、Harvey 和 Latitude 等公司已經在使用 3 Flash 模型 , 該模型可以通過 Vertex AI 和 Gemini Enterprise 獲取 。

與此同時 , 谷歌正在向所有美國用戶開放配備生成式用戶界面以及搭載了 Nano Banana Pro 的 Gemini 3 Pro 。 對于開發者而言 , 3 Flash 預覽版現已可通過 AI Studio、Google Antigravity、Gemini CLI 和 Android Studio 獲取 。

事實上 , 自從發布 Gemini 3 以來 , 谷歌每天在其 API 上處理超過一萬億個 tokens , 同時與 OpenAI 展開了激烈的發布進度競爭和性能競爭 。

本月初 , 由于谷歌在消費者市場上份額的上升 , ChatGPT 的流量開始出現下滑 , OpenAI CEO 山姆·奧特曼(Sam Altman)為此向 OpenAI 內部發了一份內部紅色警報備忘錄 。

此后不久 , OpenAI 發布了 GPT 5.2 和一個新的圖像生成模型 。 OpenAI 還宣稱其企業應用日益增長 , 并表示自 2024 年 11 月以來 , ChatGPT 的消息量增長了 8 倍 。 雖然谷歌沒有直接回應與 OpenAI 的競爭 , 但其表示此次新模型的發布將促使所有公司進行積極參與 。

參考資料:
https://blog.google/products/gemini/gemini-3-flash/

【谷歌發布Gemini 3 Flash,口述即原型,速度堪比搜索引擎】排版:劉雅坤

    推薦閱讀