伯克利大學研究者用AI構建更強負載均衡算法

伯克利大學研究者用AI構建更強負載均衡算法

加州大學伯克利分校的計算機科學家表示 , AI模型在算法發現和優化方面展現出巨大潛力 。
在一篇題為\"Barbarians at the Gate: How AI is Upending Systems Research\"的預印本論文中 , 17名伯克利大學研究人員描述了他們如何使用OpenEvolve(Google DeepMind的AlphaEvolve開源實現)來改進負載均衡算法 , 顯著超越了之前的人工設計 。
具體來說 , 作者聲稱使用OpenEvolve實現了專家并行負載均衡器(EPLB)算法的5倍加速 。 該算法用于大語言模型中 , 將Token路由到專門的專家模塊 , 這是一種減少處理參數數量的效率機制 。
作者表示 , 通過AI驅動的系統研究(ADRS) , AI模型可以迭代生成、評估和優化解決方案 , 有望改變系統研究 。 論文指出:\"隨著AI在算法設計中發揮核心作用 , 我們認為人類研究者將越來越專注于問題制定和戰略指導 。 我們的結果突出了破壞性潛力以及在AI時代適應系統研究實踐的迫切需要 。 \"
Google在5月份推廣了AlphaEvolve , 這是一個\"進化編碼智能體\" , 它提高了Google數據中心編排的效率 , 優化了張量處理單元硬件中的矩陣乘法操作 , 并優化了基于Transformer的AI模型中的FlashAttention內核實現 。
為了進一步強調機器學習作為算法發現機制的潛力 , 本周發表在《自然》雜志上的一篇來自Google DeepMind研究人員的論文描述了\"一種通過多代智能體與各種環境交互的經驗來自主發現強化學習規則的方法\" 。 到目前為止 , DeepMind研究人員聲稱 , 自動化方法未能超越人類設計的強化學習系統 。
伯克利大學團隊現在通過讓OpenEvolve找出處理大語言模型推理的GPU負載均衡的更高效方法 , 展示了基于AI優化工作的價值 。
研究人員從DeepSeek的開源EPLB實現開始 , 他們指出該實現速度較慢 , 因為它用Python編寫并依賴for循環來進行線性搜索以找到處理專家模塊工作負載的最佳GPU 。 平均而言 , DeepSeek版本需要約540毫秒來重新平衡GPU上的專家模塊 。
他們還研究了來自一個未公開前沿實驗室的非公開EPLB實現 , 該實現在19.6毫秒內處理重新平衡 。
OpenEvolve使用80%的Gemini 2.5 Flash和20%的Gemini 2.5 Flash Lite組合 , 成本不到10美元 , 用時5小時 , 提出了一種將專家模塊打包到GPU中的更高效方法——它用向量化張量操作替換了循環 , 并實現了鋸齒分區方案 , 運行時間僅為3.7毫秒 。
這比未公開的參考實現快5.0倍 , 比DeepSeek的實現快146倍 。
伯克利大學論文中描述的另一個案例研究報告稱 , 通過使用OpenEvolve , 作者能夠將關系分析的速度提高3倍 , 其中SQL查詢對每行調用大語言模型推理操作 。
【伯克利大學研究者用AI構建更強負載均衡算法】當被問及OpenEvolve的\"推理\"是否只是連接人們在可用數據中遺漏的點 , 還是顯示出新穎方法的證據時 , 共同作者、伯克利大學博士候選人Audrey Cheng通過電子郵件告訴The Register:\"我認為這些問題很難明確回答(因為它們歸結為大語言模型是否真正在'思考'或只是進行復雜的概率計算) 。 \"
\"大語言模型確實受益于在比任何個人研究者能夠理解的更大文獻語料庫上的訓練 , 這使它在發現應用其他領域思想的新方法方面具有優勢 。 目前在系統/數據庫性能研究中 , 如果算法在某種程度上顯示出顯著改進 , 我們就認為算法是'新穎的' , 即使它們借用了其他領域的思想(例如 , 見我的將網絡/操作系統公平共享思想應用于數據庫的論文) 。 基于這個標準 , 是的 , 這些發展將被研究標準認為是新穎的 。 \"
當被問及OpenEvolve是否只是從已知數據中暴力破解新穎性還是具有\"創造性\"時 , Cheng說這也是一個困難的問題 。
\"我認為思考這個問題的一種方式是思考人類現在如何想出想法 , \"Cheng說 。 \"作為研究者 , 我們知道我們'站在巨人的肩膀上' 。 只有深入理解他人的想法 , 我們才能想出'新穎的'解決方案 。 創造過程需要已知數據 。 OpenEvolve使用這些數據并將其應用于新問題(也可能想出意想不到的解決方案) 。 所以 , 我會說ADRS框架是有創造性的 。 \"
Cheng說她相信ADRS的潛在影響是巨大的 。
\"我們專注于系統性能問題 , 因為AI已經可以在這里擊敗人類專家解決方案 , \"她解釋道 。 \"性能問題通常更容易驗證 , 我們已經在行業中看到了一些初步采用(例如 , 見Datadog最近的博客文章) 。 我預期大多數大規模運行系統的公司最終將使用某種形式的ADRS進行性能調優 。 \"
一旦研究人員弄清楚如何對安全性和容錯性等其他問題進行驗證 , Cheng期望ADRS能夠提出更多新穎的解決方案 。
\"目前的瓶頸是擁有強大的評估和驗證框架 , \"她解釋道 。 \"如果這些到位 , 我想象ADRS可以廣泛應用于各種系統問題(也超越計算機科學) 。 \"
Q&A
Q1:OpenEvolve是什么?它有什么作用?
A:OpenEvolve是Google DeepMind的AlphaEvolve的開源實現 , 它是一個\"進化編碼智能體\" 。 在這項研究中 , OpenEvolve被用來改進負載均衡算法 , 通過向量化張量操作和鋸齒分區方案 , 將專家并行負載均衡器的運行時間從19.6毫秒縮短到3.7毫秒 , 實現了5倍加速 。
Q2:AI驅動的系統研究能做什么?
A:AI驅動的系統研究(ADRS)可以讓AI模型迭代生成、評估和優化解決方案 。 目前主要用于系統性能問題 , 因為AI已經能夠超越人類專家解決方案 。 研究顯示 , 這種方法不僅能優化負載均衡算法 , 還能將關系分析中SQL查詢調用大語言模型推理操作的速度提高3倍 。
Q3:使用OpenEvolve優化算法的成本高嗎?
A:成本相對較低 。 研究中使用80%的Gemini 2.5 Flash和20%的Gemini 2.5 Flash Lite組合 , 總成本不到10美元 , 用時5小時就完成了專家并行負載均衡器算法的優化 , 實現了顯著的性能提升 。


    推薦閱讀