18歲天才少年,登上Nature封面!

18歲天才少年,登上Nature封面!

文章圖片

18歲天才少年,登上Nature封面!

文章圖片

18歲天才少年,登上Nature封面!

文章圖片

18歲天才少年,登上Nature封面!

文章圖片

18歲天才少年,登上Nature封面!

文章圖片

18歲天才少年,登上Nature封面!

文章圖片

18歲天才少年,登上Nature封面!

文章圖片

18歲天才少年,登上Nature封面!

文章圖片

18歲天才少年,登上Nature封面!
編輯:KingHZ 好困
【新智元導讀】DeepSeek-R1榮登Nature封面 , 成為史上首個經嚴格同行評議的大模型 。 年僅18歲的天才少年涂津豪作為作者之一 , 以實習生身份參與其中 , 他的故事從高中生到Nature作者 , 堪稱勵志傳奇 。
DeepSeek登上Nature封面 , DeepSeek-R1成為史上第一個經過嚴格同行評議的大模型 。

梁文鋒作為唯一通訊作者發了Nature , 自然是名聲鵲起 , 一夜刷屏 。
不過 , 在一眾作者中 , Jinhao Tu的現在的通信地址竟是所中學 , 他是誰?到底什么來頭?

有媒體發現Jinhao Tu就是涂津豪——
DeepSeek的實習生、建平中學國際部的畢業生、威斯康星大學麥迪遜分校2029屆本科生、2024阿里數賽AI賽道全球第一名獲得者 。

2025年1月 - 2025年2月 , 在DeepSeek實習了兩月 , 恰好趕上了DeepSeek團隊在研究推理模型R1 。
于是 , 年僅18的涂津豪成為這次Nature封面文章的作者之一 。
之后 , 他還在騰訊做過實習生 , 主要研究推理模型的高級自主能力(agentic ability) 。

去年 , 還是高中生涂津豪已出圈:獲得了2024阿里數賽AI賽道全球第一名 , 還通過神級提示詞工程把Claude 3.5改造成推理模式 。




神級提示:Claude 3.5變「OpenAI o1」


簡單來說 , 這個提示詞能讓Claude 3.5 像o1那樣思考 , 但思維過程更細膩、更有人情味 。
它甚至模仿o1的思考方式 , 你還可以根據需要展開或折疊其思考過程 。
有了這個提示詞 , Claude 3.5變得異常強大 。 它的智力、準確度和擬人化程度都得到了巨大提升 。
這讓人震驚:17歲的少年 , 真是望塵莫及 。

Claude本身已經很強了 , 而涂津豪想為它注入一種類似o1的人類化思考模式 。

涂津豪:思考模型是好模型
他的靈感起源于人類的「意識流」 。
于是 , 他寫出了第一版思維鏈提示詞 。
然后 , 他把提示詞輸入Claude , 讓模型給出建議 。
就這樣重復了80多次 , 不斷優化、不斷打磨——最終版Thinking Claude來了 。

上下滑動查看
把這個提示詞發送給Claude后 , 你就可以問它任何問題了 。

雖說 , 能看到Thinking Claude的思考過程 , 本身很酷 。
但他也意識到 , 不是人人都想在屏幕上看到這些冗余的細節 。
他想完全復刻o1 , 因此又加上了「展開/折疊」的功能 。

憑借Claude的強大性能 , 結合Thinking Claude思維模式的加持 , 再配上強大的Artifacts功能 , 稱它為「完全體o1」也絕不為過 。
在GitHub上 , 他開源了相關項目 , 斬獲15k多星 。

開源鏈接:https://github.com/richards199999/Thinking-Claude

關于AGI的思考


在個人博客上 , 他發表了關于安全和AGI的一些思考 。
他真心相信 , 像對齊、訓練后的安全這樣的措施是人類生命的守護者 。
它們可以為模型容量、為內部的「魔王」設置一個護欄;就像把模型鎖在籠子里 , 人類可以從外面研究它 , 而不讓它傷害我們 。
而關于AGI , 他認為相當抽象 。 「通用」的邊界究竟在哪里?就連Anthropic提出的ASL分類標準都顯得模糊 。

他認為實現AGI并不意味著需要打造一個在所有領域都超越人類的系統 , 而是需要創造出在大多數領域超過普通人類水平的AI 。
但在此之前 , 必須確保AI系統能夠真正理解:

  • 謎語
  • 笑話
  • 網絡梗圖
  • 成語典故
  • 特定文化背景的內容
這些看似不重要的能力 , 恰恰能反映模型最基礎且關鍵的語言理解水平 。
現有的語言模型本質上是下一個詞預測系統 , 除非真正理解文字背后的模式 , 否則無法準確處理上述內容 。
如果模型在詞預測方面表現出色 , 或真正領悟了文字背后的奧秘 , 那么它很可能具備全面的強大能力 。



95后羅福莉
現在是獨立研究者


論文中還有一位作者——羅福莉 , 也曾在去年12月引發過全網的熱議 。
當時 , 有傳聞稱「小米開出了高達千萬級的薪酬 , 挖她去AI大模型團隊」 。
不過 , 從論文上看 , 她目前的身份是一位「獨立研究者」 。

雖然去向成迷 , 但羅福莉在學術領域的表現 , 卻是實打實地亮眼 。
根據公開資料 , 她此前在北京師范大學獲得計算機學士學位 , 并在北京大學計算語言學研究所獲得計算語言學碩士學位 。
她在AI國際頂會ACL上 , 曾一次性發表了8篇論文(其中2篇為第一作者) , 提出的詞義消歧方法和文本風格轉換框架在業界引發轟動 。
【18歲天才少年,登上Nature封面!】隨后的職業生涯 , 同樣一路高歌猛進:
  • 2019年加入阿里達摩院后 , 主導了多語言預訓練模型VECO的開發
  • 2022年加入DeepSeek , 并參與了DeepSeek-Coder、DeepSeek-V2、DeepSeek-Coder-V2、DeepSeek-V3、DeepSeek-R1等幾乎所有重要項目的研發
從谷歌學術主頁可以看到 , 她所參與論文的被引數已高達10140次 。

    推薦閱讀