Le Chat全方面對標ChatGPT,歐洲AI新貴窮追不舍

Le Chat全方面對標ChatGPT,歐洲AI新貴窮追不舍

文章圖片

Le Chat全方面對標ChatGPT,歐洲AI新貴窮追不舍

文章圖片

Le Chat全方面對標ChatGPT,歐洲AI新貴窮追不舍

文章圖片

Le Chat全方面對標ChatGPT,歐洲AI新貴窮追不舍

文章圖片

Le Chat全方面對標ChatGPT,歐洲AI新貴窮追不舍

文章圖片

機器之心報道
機器之心編輯部

Mistral AI只是想做歐洲版的OpenAI?
最近幾個月 , 由谷歌和 Meta 前研究人員建立的歐洲的 AI 初創公司 Mistral AI 有些躁動不安 。
他們接連發布了好些個開源模型 , 覆蓋不同的領域 , 包含號稱「世界上最優秀」的 OCR 模型、「對標 Claude」的多模態模型、首個推理大模型 Magistral 以及兩天前發布的「全球最佳」的開源語音模型 Voxtral 。
這樣似乎也很難讓這位歐洲 AI「新貴」感到滿意 , 他們還想在應用層面好好地卷一卷 OpenAI 。
他們將 Le Chat 再一次升級 , 引入了一些強大的新功能 , 使其更強大、更直觀 , 也更有趣 , 在功能上幾乎全方位對標 ChatGPT 。

Le Chat 的新功能
  • 深度研究模式:即使是復雜主題 , 也能快速生成結構化的研究報告 。
  • 語音模式:使用我們的新 Voxtral 模型與 Le Chat 對話 , 而不是用鍵盤輸入 。
  • 原生多語言推理:借助我們的推理模型 ——Magistral , 獲取深思熟慮的答案 。
  • 項目管理:將您的對話組織到內容豐富的文件夾中 。
  • 高級圖像編輯 , 在 Le Chat 中直接進行 , 與 Black Forest Labs 合作 。
Le Chat 新功能宣傳片
研究模式可將 Le Chat 轉變為一個協調的研究助手 , 能夠規劃、明確需求、搜索和綜合信息 。 提出一個有深度的問題 , 它會將其分解 , 收集可靠的資料 , 并構建一個結構清晰、有參考文獻支持且易于理解的報告 。
它由工具增強型深度研究 Agent 驅動 , 但設計得簡單、透明且真正有幫助 , 仿佛與一個組織良好的研究伙伴合作 。
Mistral AI 也在官網展示了一些用例 。 深度研究模式能夠追蹤市場趨勢、撰寫商業策略書、做個人計劃以及最重要的、進行學術研究 。

【Le Chat全方面對標ChatGPT,歐洲AI新貴窮追不舍】語音模式可以像和人聊天一樣與 Le Chat 交流 —— 無需打字 。 你可以在散步時頭腦風暴、在處理雜事時快速獲取答案或轉錄會議內容 。 它由 Mistral 新的語音輸入模型 Voxtral 驅動 , 專為自然、低延遲的語音識別而構建 , 能跟上用戶的工作速度 。
但目前 Le Chat 僅支持語音轉文字的輸入 , 該功能并非實時語音對話 。
所以 , 跟電子助手聊天的功能依舊沒有實現 , 更別提 Grok 4 Ani 那樣的數字伴侶了 。
在圖像編輯功能方面 , 可以通過「移除物體」或「將我放置在另一個城市」等簡單提示來創建并編輯圖像 。 模型支持轉換場景 , 同時保留角色和細節 。 這有助于保證編輯的一致性:可以保持人物、物體和設計元素在圖像之間的不會變得認不出來 。
圖像編輯這塊 , Le Chat 似乎做得出人意料的好 。 網友在論壇分享了使用體驗 , 認為 Le Chat 做得比 OpenAI 更好 。
「OpenAI 的模型在編輯時會改變整個圖像 , 導致無關區域出現細節錯誤 。 (Le Chat)似乎完美地保留了與查詢無關的圖像部分 , 并選擇性地應用編輯 , 這令人印象深刻!」

網友上傳了一張家庭辦公室的照片 , 并提出了以下提示:「修復照片底部略微撕裂的灰色面板 , 讓它們看起來像全新的」 , 編輯結果非常令人滿意 。


上圖為原始圖像 , 下圖為編輯后圖像
對于這些新功能 , 我們的讀者想必已經非常熟悉 。 在這一次的大更新之后 , Le Chat 在功能上基本實現了與 ChatGPT 等行業領先的產品保持一致 。
最近 Mistral AI 的動作確實讓人看到了歐洲在大模型領域保持追趕的勢頭 。 對此 , 網友們表達了對 Mistral 快速追趕的興奮 。


值得分享的是 , Le Chat 在法語中意為「貓」 , 而 Mistral AI 的主頁底部就有一只像素貓咪 , Mistral AI 圖標也形似一只貓貓頭 , 非常可愛 。

Mistral AI 的語音識別模型
7 月 15 日 , Mistral AI 發布了全新的語音識別模型 Voxtral , 號稱是「全球最佳(且開源)」的語音識別模型 。

Voxtral 在語音轉寫方面全面超越了 Whisper large-v3 , 當前領先的開放源代碼語音轉寫模型 。 它在所有任務中都擊敗了 GPT-4o mini Transcribe 和 Gemini 2.5 Flash , 并在英語短形式和 Mozilla Common Voice 上取得了最先進的結果 , 超越了 ElevenLabs Scribe , 展示了其強大的多語言能力 。

Voxtral 3B 和 Voxtral 24B 模型不僅僅具備語音轉錄功能 , 還具備以下能力:
  • 超長上下文理解:支持最長 32k token 的上下文 , 轉錄最長達 30 分鐘音頻 , 理解可達 40 分鐘;
  • 內置問答與摘要功能:無需將語音識別與語言模型串聯 , 即可直接針對音頻內容提問或生成結構化摘要;
  • 原生多語種支持:具備自動語言識別功能 , 在全球主流語言(如英語、西班牙語、法語、葡萄牙語、印地語、德語、荷蘭語、意大利語等)中均達到業內領先表現 , 助力團隊以單一系統服務全球用戶;
  • 從語音直接觸發函數調用:可根據用戶的語音意圖直接觸發后端函數、工作流或 API 調用 , 無需中間解析步驟 , 實現語音到系統指令的無縫轉換;
  • 強大的文本理解能力:延續其語言模型基?。 ∕istral Small 3.1)在文本處理方面的高性能表現 。

    推薦閱讀