手機也能跑，騰訊混元一口氣開源4款小模型_ai|GitHub

文章圖片

文章圖片

機器之心報道
機器之心編輯部

剛剛，騰訊混元團隊宣布一口氣開源了 4 款小模型 —— 最大的只有 7B ，另外還包括 4B、1.8B 和 0.5B 三個型號。

這些小語言模型使用「消費級顯卡即可運行，適用于筆記本電腦、手機、智能座艙、智能家居等低功耗場景，且支持垂直領域低成本微調。」

目前，這四個模型已在 GitHub 和 HuggingFace 上線。騰訊混元團隊表示， ARM、高通、英特爾、聯發科技等多個消費級終端芯片平臺也都宣布支持部署這些模型。

GitHub:
Hunyuan-0.5B：GitHub - Tencent-Hunyuan/Hunyuan-0.5B Hunyuan-1.8B：https://github.com/Tencent-Hunyuan/Hunyuan-1.8B Hunyuan-4B：https://github.com/Tencent-Hunyuan/Hunyuan-4B Hunyuan-7B：https://github.com/Tencent-Hunyuan/Hunyuan-7B
Hugging Face:
Hunyuan-0.5B：https://huggingface.co/tencent/Hunyuan-0.5B-Instruct Hunyuan-1.8B：https://huggingface.co/tencent/Hunyuan-1.8B-Instruct Hunyuan-4B：https://huggingface.co/tencent/Hunyuan-4B-Instruct Hunyuan-7B：https://huggingface.co/tencent/Hunyuan-7B-Instruct
更重要的是，這 4 個開源模型的特點不僅是小，而且還都屬于融合推理模型，具備推理速度快、性價比高的特點，用戶可根據使用場景靈活選擇模型思考模式：

快思考（fast thinking）模式提供簡潔、高效的輸出；慢思考（slow thinking）涉及解決復雜問題，具備更全面的推理步驟。
效果上，四個模型均實現了跟業界同尺寸模型的對標，特別是在語言理解、數學、推理等領域有出色表現，在多個公開測試集上得分達到了領先水平。

騰訊混元表示，這四個模型的亮點在于 agent 和長文能力。跟此前開源的 Hunyuan-A13B 模型一樣，技術上通過精心的數據構建和強化學習獎勵信號設計，提升了模型在任務規劃、工具調用和復雜決策以及反思等 agent 能力上的表現，讓模型實際應用中可以輕松勝任深度搜索、電子表格操作、旅行攻略規劃等任務。

此外，模型原生長上下文窗口達到了 256k ，意味著模型可以一次性記住并處理相當于 40 萬中文漢字或 50 萬英文單詞的超長內容，相當于一口氣讀完 3 本《哈利波特》小說，并且能記住所有人物關系、劇情細節，還能根據這些內容討論后續故事發展。

部署上，四個模型均只需單卡即可部署，部分 PC、手機、平板等設備可直接接入。并且，模型具有較強的開放性，主流推理框架（例如， SGLang ， vLLM 和 TensorRT-LLM）和多種量化格式均能夠支持。

機器之心也做了簡單的嘗試，其整體表現相當不錯。

上下滑動查看

體驗地址：https://hunyuan.tencent.com/modelSquare/home/list

已落地多元業務場景

騰訊透露，該系列模型已在內部多個核心業務中「身經百戰」，其可用性和實用性得到了充分檢驗：

生產力工具：騰訊會議 AI 小助手、微信讀書 AI 問書等，利用其超長上下文能力，實現對萬字會議紀要、全本圖書的精準理解和摘要。端側應用：騰訊手機管家利用小模型實現毫秒級的垃圾短信精準攔截，且全程保護用戶隱私（隱私零上傳）；騰訊智能座艙則通過雙模型協作架構，解決了車載環境的功耗與響應難題。高并發場景：搜狗輸入法、騰訊地圖、微信輸入法「問 AI」等產品，借助模型的快速推理和意圖識別能力，顯著提升了嘈雜環境下的識別準確率和用戶交互體驗。垂直行業：在金融領域， AI 助手通過少量微調即可實現超過 95% 的意圖識別準確率；在游戲領域，《QQ 飛車》手游的 NPC 對話、多語言及方言翻譯也因模型的加持而變得更加智能和流暢。
中國 AI 開源浪潮中的騰訊布局

「小語言模型是智能體 AI 的未來。」—— 英偉達近期的研究《Small Language Models are the Future of Agentic AI》似乎為騰訊此次的開源行動寫下了最好的注腳。

眾所周知，最近的開源 AI 模型可以說是異常熱鬧，來自中國的玩家們已經掀起了好幾股熱潮。而騰訊混元也是其中一大主要「弄潮兒」，其開源模型已覆蓋文本、圖像、視頻和 3D 生成等多個模態。

騰訊混元此前已經陸續開源了激活參數量達 52B（總參數量 389B）的 Hunyuan Large 和首個混合推理 MoE 模型 Hunyuan-A13B ，這些模型憑借架構上的創新以及在性能和效果上的不錯表現，在開源社區受到廣泛關注。

多模態方面，混元還開放了完整多模態生成能力及工具集插件，陸續開源了業界領先的文生圖、視頻生成和 3D 生成能力，提供接近商業模型性能的開源基座，方便社區基于業務和使用場景定制，圖像、視頻衍生模型數量達到 3000 個。

上周，騰訊發布并開源混元 3D 世界模型 1.0 ，這一模型一經發布即迅速登上 Hugging Face 趨勢榜第二，下載量飆到近 9k ，混元 3D 世界模型技術報告還拿下了 Hugging Face 論文熱榜第一。

很顯然，不管是科技巨頭，還是創業公司，中國的 AI 模型開發者們都越來越喜歡開源了，甚至可以說已經成為一種共識。你覺得這一趨勢背后的原因是什么呢？

參考鏈接
https://x.com/TencentHunyuan/status/1952262079051940322
https://arxiv.org/abs/2506.02153
【手機也能跑，騰訊混元一口氣開源4款小模型】

手機也能跑，騰訊混元一口氣開源4款小模型

推薦閱讀

蜈蚣是害蟲還是益蟲啊蜈蚣屬于害蟲還是益蟲

2022廣州住房公積金利率調整后有什么好處？

枕巾多久洗一次枕巾什么時候洗一次

結婚為什么吃烤乳豬不好結婚為什么吃烤乳豬

小提琴是什么調

成都歡樂谷門票價格成都歡樂谷門票多少錢一張

求鑒定阿迪達斯貝殼頭小熊鞋

如何注銷申請的刷寶賬號

上海虹口區公租房入住流程

回水排氣閥不出水也不出氣怎么處理

特斯拉充電樁安裝有哪些條件

其實我不在乎初三作文

python考勤管理系統 Python上課點名系統附源碼

助人為樂手抄報我是小天使幫助他人手抄報怎么畫

怎樣調出一杯好喝的咖啡

西餐擺盤怎么擺s型