
文章圖片

文章圖片

機器之心報道
編輯:杜偉
在 AI 時代的浪潮下 , 頂尖人才影響力空前高漲 , 其地位更被市場推升至了前所未有的高度 。 無論是谷歌 Transformer 論文八子 , 還是從 OpenAI 出走的科學家 , 他們要么自立門戶 , 拿到億級投資、百億級估值 , 或者跳槽到他處 , 憑己之力拉近企業間的技術代差甚至影響競爭格局 。
頂尖人才的供給增長速度似乎跟不上互聯網大廠、初創公司急劇膨脹的需求 , 因此擁有極強議價能力 。 企業為了招攬這些具備突破性能力、能引領方向或解決關鍵瓶頸的人才 , 使出了渾身解數 。
這場看起來一時不會結束的人才軍備競賽 , 在國內同樣呈現出了高強度、系統性、全球化的競爭態勢 。
互聯網大廠紛紛放大招 , 京東 TGT 頂尖青年技術天才計劃、字節 Top Seed 人才計劃、騰訊青云計劃、百度文心?新星計劃…… 各種行業 Top 薪酬甚至薪酬不設上限 , 鈔能力拉滿 , 誓要將頂尖人才收入麾下 。
企業與人才雙贏的實現 , 需要“雙向奔赴” 。
最近 , 一場聚集了產業技術大佬和高校技術天才的線下技術沙龍上 , 我們聽到了他們對于前沿技術方向的深度探討和雙方對技術人才發展共同的思考和期待 。
京東技術沙龍零售專場
這是今年 5 月全球啟動的 “京東技術沙龍” 活動的最后一場 , 多位京東零售內部大模型相關技術團隊負責人來到現場 , 與大家分享頂會論文和真實場景案例 , 展示最新前沿技術進展與創新應用實踐的融合 。
來自核心技術部門的青年技術專家也以學長學姐的身份向同學們傳授經驗、分享心得 , 幫助大家快速了解京東豐富的業務場景、以及如何找到自己最適配的團隊和崗位 。
如何從新人快速成長為技術骨干 , 實現從學界研究到產業實踐的角色轉變?懷揣著和現場同學們一樣的好奇心 , 我們與來自京東零售產研的 5 位青年技術專家聊了聊 , 他們中最大不過 92 年、最小 98 年 。 他們的經歷 , 也許可以為即將踏入職場的新人提供一些參考和借鑒 。
1 年期新人通關:
實驗室到業務前線 , 克服畏難心理啃下硬骨頭
洛川 , 一位剛滿 27 歲的大男生 。
2024 年 , 在取得中國科學技術大學計算機軟件與理論博士學位之后 , 他加入了零售 AI Infra 團隊 。
與所有初入職場的同學一樣 , 從校園到職場 , 洛川充滿忐忑 。
但全方位的支持體系 , 徹底打消了他的擔憂 。
洛川有兩位業務 + 技術導師 , 每個月他們都會抽出時間找他一起聊一聊 , 無論是個人成長方面的疑慮 , 還是技術層面的困惑 。 很快 , 洛川開始系統性地熟悉所在部門的技術棧、代碼庫 , 并逐漸適應 AI Infra 團隊的工作節奏 。
迅速融入的洛川(左 3)和伙伴們一起團建
幾個月后 , 已經順利渡過新人階段的洛川迫切地希望將自己博士期間的研究成果真正服務于實際問題 。 「以往的研究大多停留在論文層面 , 而京東擁有豐富業務場景和海量產業數據 , 讓我的研究終于有了規模化應用的機會 。 」
初步熟悉業務之后 , 洛川開始主動思考自己所在技術領域存在的痛點 。 他所在的團隊主要負責構建和優化支撐大規模 AI 應用的基礎設施 , 涵蓋集群管理、算力調度、數據與樣本中心建設、訓練與推理引擎優化等 。
過程中 , 通過自己對京東電商平臺的長時間觀察以及導師的指導 , 洛川明確了想要突破的目標 。
他發現 , 進入大模型時代以來 , 推薦領域開始利用 Scaling Law 帶來增益 。 不過 , 隨著推薦模型中稀疏參數規模的持續增長 , 加上像京東這種電商平臺中用戶行為序列往往長達數萬甚至十萬 , 這些參數的存儲、通信以及查詢開銷成了大規模點擊率預測(CTR)模型分布式訓練的瓶頸 , 影響到了算法團隊的迭代效率 。
面對這一難題 , 洛川躍躍欲試 。 在了解業務團隊的核心訴求并精準定位技術難點之后 , 他迅速投入 , 分析了學術界和工業界現有方案并著手制定適合業務場景的技術規劃和可行落地方案 。
很快 , 他和團隊一起設計并實現了一套重要性感知的量化與緩存方案 , 該方案顯著減少了稀疏參數的存儲、通信和查詢開銷 , 大幅加速 CTR 模型的分布式訓練進程 。 看到實際效果落地 , 洛川深感「自己的辛苦沒有白費 。」
這只是洛川這一年來的一個縮影 , 如今的他已經找準了自己的定位 , 與 AI Infra 團隊一道攻克一個又一個技術難題 。 「作為新人 , 要克服畏難心理 , 深入一個領域 , 勇于啃下硬骨頭 。 」
3 年期進階通關:
瞄準真實痛點 , 從被動解題到主動提出問題
“一年級” 職場新人洛川的經歷 , 在他的兩位前輩謙屹和田野看來似曾相識 。
謙屹和田野 3 年前從中科院自動化所博士畢業后便加入了京東 。
謙屹專注于圖像生成、多模態大語言模型、OCR 等計算機視覺研究 。 田野專注于搜索相關性業務 , 以及 NLP 技術在搜索場景的落地 。 加入京東后分別入職廣告產研部和搜推技術部 。
當他們前后腳加入京東時 , 還是遇到了不同的挑戰和問題 。
田野稱自己需要克服的最大挑戰是實驗室思維到企業工程師思維的轉變 , 這源于不同環境下問題定義與數據體系的根本性差異 。
實驗室環境下的研究通常針對明確定義的任務進行:問題本身、應用場景以及訓練集和測試集都是預先給定且相對固定的 , 目標聚焦于在特定數據集上提升指標 。 而在真實的工業級電商搜索場景中 , 業務的核心問題會隨著發展階段快速變化;同時 , 工業場景中不存在現成的標準數據集 , 要求工程師自主構建整個數據閉環 。
這種轉型并不容易 , 「我要逼自己從純粹的解題者轉變為具備持續業務洞察力、能動態定義核心問題并自主構建適配數據與評估體系的問題定義者 + 架構師 。 」
田野花了很長一段時間才適應了新角色 。 此后 , 他便開始如魚得水 , 利用自己的專業知識深度參與到搜索場景的體驗升級 。 在跑算法、訓大模型的過程中 , 田野最擔心顯卡不夠用 , 但京東內部提供了一套靈活的資源傾斜策略 , 對長期有價值的項目全力支持 。 田野受到了很大的鼓舞 , 「如今在算力資源上得到了保證 , 自己也就再無后顧之憂 , 可以放手去研究生成式搜索技術了 。 」
而謙屹剛入職時最直觀的感受是 , 原本以為自己積累了深厚的技術底子 , 但在工業界 , 業務需求與技術迭代的速度太快 , 原有的知識與技能面就顯得窄了 。
好在 , 他可以直接面向實際應用場景 , 對業務痛點進行最直接、最深刻的體察 。 謙屹特別提到了自己參與的一項電商廣告圖片生成創新工作 —— 基于人類反饋的可信賴圖像生成(RFNet +RFFT) , 在豐富人類審核數據的基礎上 , 利用 RLHF 技術 , 通過 RL 算法將人類偏好反饋給生成模型 , 有效降低了商品形變、背景錯位等問題的發生概率 , 提升了模型生成可用圖片的能力 。
RFFT 相較其他方法實現了 SOTA [1
謙屹開始慢慢跳出過去深耕的垂直領域 , 技術視野變得更廣 , 掌握的更多知識和技能可以輕松應對多元化業務的挑戰 。
短短三年 , 他發表了 10 余篇創新性科研成果 , 并被多個 AI 頂會以及 AI 頂刊收錄 。 目前 , 他與團隊正積極探索前沿生成式 AI 能力對廣告創意生成的賦能 , 尤其是多模態大模型批量化和自動化創意生產 。
無論是田野還是謙屹 , 他們瞄準千萬消費者和商家的真實體驗痛點 , 在應對和解決業務挑戰中獲得了快速的成長和收獲 。
95 后向前一步:
敢想、敢為 , 探索多種可能性
其實在京東零售技術團隊中 , 還有很多類似的年輕算法工程師們 , 95 后的長林和島嶼就經常和前面 3 位一起交流、切磋技術問題 。
長林研究的方向是大模型蒸餾和數據選擇 , 側重低資源情況下大模型的訓練與規模化應用 , 由于現代深度學習與大模型的成果依賴海量數據、巨大參數規模和高昂算力成本 , 使得低資源訓練極具挑戰 。 「學術訓練的核心在于將現實問題簡化、抽象為邊界清晰的數學問題求解 , 但現在面對的問題不是孤立的知識點 , 而是技術、業務、資源、人員交織的系統」 。
肯定不能「拿著錘子找釘子」的生搬硬套 , 長林開始積極請教周圍熱情的導師、前輩、學長學姐 , 與他們面對面交流、探索的過程中他們給了長林很大的自由度與耐心 , 「不要怕 , 達成目標的手段并不唯一 , 要敢想、敢為、探索多種可能性 , 我們來兜底」 , 這是他經常聽過的鼓勵與鞭策 。
他提出僅選擇信息最豐富的樣本子集進行訓練 , 以在模型性能和訓練效率之間取得更好平衡 。 最終證明 , 在平均僅采樣 70%-80% 數據的情況下 , 模型精度能夠保持與原模型相當 , 且優于其他數據選擇方法 。
通過數據選擇突破冪率的 Scaling Law [2
近期 , 長林的三篇論文分別被頂會 ICLR、AAAI 和 ACL 接收 , 還提交了 8 項專利 , 可謂收獲滿滿 。 其中一項代表性工作是基于動態數據選擇加速模型訓練 。
同樣 95 后的島嶼 , 她的工作重點在大語言模型的產品化應用 。 在電商場景中 , 通過大模型生成文案 , 幫助用戶選購、為用戶提供專業商品建議 。 傳統模型更注重語言的高效和準確 , 而 95 后的她認為 , 要讓用戶真正逛起來 , 語言提供的情緒價值同樣重要 , 于是她提出同時考慮大模型的語言風格 , 豐富個性化的語言表達以適配不同的用戶需求 , 這個建議一提出就在內部獲得認可 , 團隊也配合她一起更新了方向和規劃 , 這讓島嶼備受鼓舞 , 「在這里 , 溝通沒有門檻 , 行業大佬會直接參與和指導項目 , 能提升用戶體驗 , 就是第一優先級 。 」
自由的思想碰撞 × 扎實的工程實踐 × 包容的成長環境 , 讓這些 95 后們能充分追求自己熱愛的技術方向 。 能跳出自身固有角色去主動思考問題、提出建議 , 創造力得到了充分激發 。
人才建設 , 非一時之功
從高校實驗室邁入到覆蓋億級用戶的京東零售大環境 , 從碩博生轉換為企業工程師 , 幾位青年技術專家的成長之路走得很穩 , 技術帶來的能量得以發揮最大的價值 。
技術沙龍上 , 青年技術專家與同學們交流
京東希望能為更多像他們一樣的青年技術人才 , 提供科技溫度和產業厚度共同構筑的成長熱土 , 讓更多年輕人在這里加速成長、施展才華、定義未來 。
2017 年起 , 京東就啟動了面向青年技術人才的 “博士管培生項目” ,一批優秀的技術人已經迅速成長為各個技術板塊的核心骨干 , 今年 5 月 8 日再次加磅 , 啟動了京東 TGT 頂尖青年技術天才計劃 , 該計劃面向全球高校本碩博畢業生以及畢業兩年內的技術人才 , 薪酬「不設上限」 , 涵蓋了八大研究方向:多模態大模型與應用、機器學習、搜索推薦廣告、空間與具身智能、高性能與云計算、大數據、AI Infra 以及安全等 。
對人才吸引的誠意與決心 , 以及更加立體的人才培養模式、多維度又專業化的指導 , 京東希望進一步為人才成長提供成長保障 , 持續優化的人才梯度建設也將不斷為京東及其業務賦能 。
未來 , 這支融合了前沿探索精神和實戰經驗的年輕化技術軍團 , 不僅更能貼近新生代用戶與市場的思維 , 還將繼續驅動京東在 AI、大數據、云計算等核心領域的創新與突破 , 構筑起難以復制的技術競爭力護城河 。
最后 , 點擊“原文鏈接” 直達 “京東 TGT 頂尖青年技術天才計劃” 進行投遞 , 一起用技術創造更多美好吧!
參考鏈接:
[1
論文地址:https://arxiv.org/pdf/2408.00418
[2
論文地址:https://openreview.net/pdf?id=7oPAgqxNb20
【95后,邊改造業務邊發AI頂會論文,是怎樣的體驗?】原文鏈接:https://mp.weixin.qq.com/s/6B0_bZ9EJYFwrvpb1r_hRw?scene=25#wechat_redirect
推薦閱讀
- 雷軍宣布7月2日返場直播:分享YU7上市背后故事
- 8000mAh電池、衛星通信、無線充電、側邊指紋,這是不是最猛中端機?
- 銳龍7-8845HS不值錢了?玄派16英寸大屏本國補后2793元起
- iPhone16Pro,國補后低至5499元,入手真香!
- 7月國補后,可以“閉眼買”的3款直屏手機,可一步到位用六年
- 7620mAh+天璣8400滿血版,vivoY300GT,國補后1614元!
- 紅米開啟降價模式,驍龍8至尊版+2K屏+120W閃充,國補后低至2719
- 國補后,“值得撿漏”的驍龍8Gen3旗艦,16+512GB價格“大跳水”
- 三星曲面折疊屏手機專利曝光,后續新機蓄勢待發
- 大模型競爭:落后生的兩條追趕路線
