480億好未來,攻堅大模型

480億好未來,攻堅大模型

文章圖片

480億好未來,攻堅大模型

文章圖片

480億好未來,攻堅大模型

文章圖片

480億好未來,攻堅大模型

文章圖片

480億好未來,攻堅大模型

作者/ 何己派 編輯/ 譚璐

2023年春 , 清晨的斯坦福大學校園 , 很安靜 , 好未來創始人張邦鑫 , 約上CTO田密 , 一起散步 。

二人心事重重 , 氣氛有點嚴肅 。 張邦鑫一開口 , 直入主題:“能不能請你放下別的所有工作 , 只做大模型?”

那時 , ChatGPT發布已有數月 , 張邦鑫第一時間關注 , 部署了非正式預研 , 沒拿定主意要不要跟進 。

他帶著團隊專程赴美 , 考察大模型的進展 。

一周多時間 , 團隊連軸轉 , 英偉達、谷歌等巨頭以及Figure這樣的初創公司 , 一口氣走了個遍 。 白天出門 , 夜里復盤討論 。

地陪司機忍不住嘀咕:“別人都是去哪兒玩 , 去哪兒看show , 你們公司一天安排六七個訪問行程 , 也太拼了 。 ”

“走完一圈 , 挺受震撼 , 我們意識到 , AI將給教育帶來巨大顛覆 。 ”田密接受《21CBR》記者專訪時表示 。

田密


那場清晨對話的最后 , 田密立下軍令狀——如果大模型做失敗了 , 就離開公司 。

他帶著幾十人的隊伍 , 埋頭攻堅 , 半年時間 , 自研發布數學大模型MathGPT , 后取名為“九章” 。

“九章”在數學科目尤其出眾 , 2024年權威的MathEval數學能力測評中 , 位列國內外數十個大模型榜首 , 且深度應用到學習機等核心產品 。

據剛披露的財報 , 3-5月 , 好未來凈收入同比增長39% , AI驅動的智能硬件業務 , 成為重要主力 。 到7月末 , 好未來市值約480億元人民幣 。

今年 , 田密團隊開始推動大模型走進公立學校 , 第一版產品“九章愛學大小屏” , 已在全國四個省市試點 。

“AI老師 , 是好未來堅定要做的方向 。 ”田密希望 , 真人老師能干的事 , 未來AI老師都能干 , 且干得更好 。

以下為田密自述 , 經編輯整理:


押注“九章”


2022年11月底 , ChatGPT問世 , 我們第一時間開通賬號 , 用完以后 , 大家很驚嘆 。

過完春節就發現 , 身邊討論的人越來越多 , 產品已經破圈 。 邦鑫和我們幾個人 , 一直在討論 , 要不要跟進 。

當時還沒買新卡 , 就用手頭一批英偉達V100卡 , 做了些預研測試 。

大家覺得 , 還得去發源地看看 , 去美國一考察 , 感受很深刻 , 技術革命來了 , 好未來必須all in , 全力投入大模型 。



帶著幾十人的團隊 , 我重新回到一線攻堅狀態 。

大模型要順利起步 , 三要素的投入不能少 , 算力、算法人員、數據 , 都以億為單位 , 很燒錢 , 成本投入是首要問題 。

幸運的是 , 老板的決心很大 。

起初我想過 , 租一批大廠的卡訓練 。 邦鑫建議 , 自己買卡比較可控 , 在教育公司里 , 好未來的算力投入可能最大 。

算法的關鍵在于人 。 當時 , 集團算法人員大約有100多個 , 幾乎全部抽調來做大模型 。

好未來已積累大量教育數據 , 而做模型的強化和微調 , 光有教育垂類數據不夠 。 我們又專門建了一個基地 , 雇人做數據標注 。

最初 , 團隊打算從零開始 , 訓練一個自己的大模型 。 后來 , 優秀的開源模型不斷涌現 , 自己做預訓練 , 不劃算 。



我們果斷切換方向 , 基于DeepSeek、LLaMA等開源模型 , 結合學而思獨有的教育數據 , 進行二次訓練 , 再用多個模型進行交叉驗證和投票 , 得到專業的教育大模型 。

站在巨人肩膀上 , 模型能力大幅提升 。

數學是大模型應用最具挑戰的領域之一 。 做大模型的廠商很多 , 從數學切入的 , 只有好未來 。

好未來做數學培訓起家 , 積累很多 , 2017年就成立AI Lab , 有傳統AI打下的地基 , 過渡下來 , 過程很順 。

我們花了半年 , 做出了MathGPT第一版 , 2023年11月 , MathGPT成為首批通過備案的教育大模型 。



“九章”這個名字 , 源自《九章算術》 , 是世界上最早的印刷本數學書 。 “九章”好聽好記且有故事 , 大家取名沒有糾結 , 一致通過 。

傳統AI時代 , 針對多個應用場景 , 我們要用到上百個小模型 , 好未來就開發了大量AI助手 , 協助老師備課、批改作業等 , 功能較為零散、簡單 。

現在 , 一個大模型能搞定很多事 。

更重要的變化在于 , AI能力正逐步強大 , 能實現教、學、練的閉環 , 從過去以老師為中心 , 真正轉向以學生為中心 。


軟硬結合


做大模型不是炫技 , 幫用戶解決現實問題 , 才是第一位的 。

九章大模型以數學起家 , 已將能力延伸到全學段、全學科 。

比如 , 語文學科 , 提供作文輔導寫作、作文批改等功能;英語學科 , 提供英語作文批改、口語對話練習等功能 。



最早 , 團隊從AI解題這項能力做起 , 我們很快意識到 , 這不是實際痛點 。 家長要的是AI能給孩子批改作業 , 把錯題講明白 , 減少他們輔導作業的工作量 , 降低請家教的成本 。

九章就選擇聚焦三個方向——批改、講題、精準練 。

傳統AI , 只能批改選擇題、判斷題等簡單題型;一有大模型 , 不光支持所有題型 , 且在批改過程中 , 能指出答題錯在哪步 , 具體關聯哪個知識點 。

至于講題 , 好未來會實打實訓練AI老師 , 劃分6個維度的指標 , 由真人老師打分 , 評價其講題的邏輯性、過程的連貫性等 。

所謂精準練 , 基于知識圖譜 , 從孩子做對或做錯一道題 , AI可判斷其是否掌握知識點 , 精準推送孩子需要的題目 。

這些技術能力 , 正以多種應用方式落地 , 既嵌入好未來現有的APP、智能硬件和學習服務 , 也有獨立的APP和小程序“九章愛學” , 并提供API和智能體接口 。

我們也逐漸認清一個現實:純AI軟件很難單獨落地 , 軟硬結合可能是現在唯一的出路 。

在教育硬件 , 學習機的復雜程度又最高 。

2023年2月 , 好未來推出第一代學而思學習機 , 定價4000多元 , 錨定“好內容” , 當時有人估算 , 僅內置的課程資源 , 至少等于30萬元的培訓費 。

到第二代產品 , 大模型能力接入 , 升級為“好內容+好AI” , “好AI”即九章與DeepSeek形成的雙核大模型 , 強化學習機的智能交互與精準分析能力 。

今年5月 , 我們又發布旗艦產品T系列 , 搭載小思智慧島Pro , 這是個軟硬一體化的攝像頭體系 。 學生伏在桌上寫作業 , 攝像頭能直接拍到紙上題目 , 可智能提供作業輔導 。



我們正在努力 , 往多模態AI老師的方向進化 , 省去每次主動喚醒AI的動作 , 這樣 , 桌面放上教科書或試卷 , 學生手寫時 , 攝像頭實時查看 , 實時按步驟講解 , 如同真人老師面對面輔導 。

配合學習機等硬件的更新 , 九章大模型的AI能力 , 也保持以月為單位的迭代節奏 。


提速進化


我們已開啟AI產品進校業務 , 2024年底立項 , 今年3月推出第一版To G的學習機 。

第一批試點 , 已有三個月時間 。

據學校反饋 , 兩個班級對比 , 有AI工具賦能的班級 , 數學成績的均分 , 較另一個班高出7分 , 預測學期末將拉開十幾分的差距 。



AI進校 , 有個逐漸接受的過程 , 關鍵在于信任和效果 , 我們有耐心 , 也有信心 。

我們內部 , 也在鍛造AI化組織 。

一是轉變思路 , 業務遇到問題 , 先問大模型 , 能不能做、怎么做;二是工作內容的“AI率”提升 。

內部明確要求 , 未來數月 , 至少有某項工作由AI替代 , 如法務、財務的合同審核 , 基本交給大模型 , 大幅提效 。

核心技術路線上 , 好未來會堅定走向“AI老師” 。 如同無人駕駛等級的L0到L5 , 教育行業的AI老師 , 大體也是如此進階 。

L1級別 , AI只能打輔助 , 做些簡單重復的工作 。

當前所處的L2 , AI能勝任某個模塊 , 比如作業批改 , 屬于“輔助駕駛”階段 , 老師可以“脫手”“脫腳” , 不能“脫眼” 。

L3級別 , 進入“有條件的無人駕駛” , 可部分“脫眼” , 不能“脫腦” 。 我們希望 , 未來兩三年能實現L3 。



比如 , 家庭場景下 , 學習平板里的AI老師 , 可自主幫忙完成學業規劃 , 也能實現做題-批改-講題-練題的完整閉環 。

一旦到L4級別 , AI老師可跨場景切換 , 家長能放心把孩子的學習交給AI , 除非出現個別極端情況 , 基本不用接管 。

那時 , 教育業將迎來徹底變革 。

我入局大模型兩年 , 感到壓力最大的 , 是剛接下任務時 , 一切未知 , 不知從何著手 。

現在心里踏實多了 , 應對挑戰的方法論 , 也很明確:從用戶使用過程和經驗中發現不足 , 思考技術改進的路徑 , 探討更豐富的交互形態 。

【480億好未來,攻堅大模型】就個人而言 , 之前十幾年 , 待在騰訊、阿里 , 花名一直是“老師” 。 或許 , 冥冥之中就已確定我的角色 。

    推薦閱讀