中文名確定!Token正式被譯名為“詞元”:我國日均調用量突破140萬億

中文名確定!Token正式被譯名為“詞元”:我國日均調用量突破140萬億

快科技3月24日消息 , 國家數據局在官方公告中首次使用“詞元”作為Token的標準譯名 , 標志著這一術語在中文人工智能領域的正式確立 。
國家數據局局長劉烈宏24日在國新辦舉行的新聞發布會上表示 , 到今年3月 , 我國日均詞元(Token)調用量已超過140萬億 , 相比2024年初的1000億增長了1000多倍 , 相比2025年底的100萬億 , 三個月時間又增長了40%多 。
“日均詞元調用量的大量增加 , 充分表明中國的人工智能發展進入了快速增長階段 。 ”劉烈宏表示 , 人工智能應用場景在不斷深化 , 從能對話到能決策執行的智能體 , 中國人工智能產業的競爭力在顯著增強 , 現在備受關注的Token出海 , 就是產業競爭力增強的一個標志 。
《人民日報》在2026年1月發布《漫談詞元》科普文章 , 將Token定義為“處理文本的最小數據單元” , 蘋果中國官網、央視新聞、中國計算機學會(CCF)等技術文檔也統一使用“詞元” 。
【中文名確定!Token正式被譯名為“詞元”:我國日均調用量突破140萬億】怎么理解詞元?簡單來說 , 詞元是人工智能大模型為了高效處理數據 , 把數據進行拆分后的“最小信息載體” , 可以理解為“字/詞片段/符號”等 。
比如“我愛中國!” , 可拆分成“我”“愛”“中國”“!”4個詞元 。
如果說互聯網時代信息傳輸的核心度量是流量 , 那么人工智能時代 , 這一關鍵指標正變為詞元 。 用戶輸入的每一個字 , 模型生成的每一段話、識別的每一幅圖像 , 都在消耗詞元 。

    推薦閱讀