人工智能研究新突破：英偉達、蘋果、谷歌和斯坦福探索下一步發展

2026-04-27 人工智能蘋果英偉達 Google

在OpenAI于2022年發布ChatGPT并引起公眾廣泛關注之前，人工智能一直在研究實驗室中悄然發展，并在科學會議上被討論。雖然企業界目前的注意力主要集中在智能體和重塑企業生產的巨大期望上，但一群工程師和科學家一直在研究下一步的發展方向。
在灣區機器學習研討會（BayLearn）上，演講者們提供了未來發展的線索。這是一個來自硅谷各地的高級科學家和工程師的年度聚會。今年的活動由圣克拉拉大學工程學院于周四主辦，讓人們得以一窺一些人工智能領域領軍人物如何設想該技術的未來影響，因為公司和研究實驗室正在完善他們的人工智能方法。
\"我們不僅僅是在構建系統，我們還在思考系統試圖解決的根本問題， \"英偉達公司應用深度學習研究副總裁Bryan Catanzaro在會議演講中說道。
英偉達的Nemotron推動加速計算
英偉達實現系統問題解決方法的重要組成部分涉及Nemotron ，這是該芯片制造商的開源人工智能技術集合，旨在使人工智能開發在每個階段都更加高效。這些技術包括多模態模型和數據集、預訓練和后訓練工具、精度算法以及在GPU集群上擴展人工智能的軟件。
Nemotron是\"神經模塊\"和變形金剛玩具系列中威震天角色的混成詞，是英偉達加速計算愿景的核心。
\"Nemotron確實是英偉達未來加速計算思考方式的基礎部分， \"Catanzaro說。 \"加速計算真正關乎專業化......以及做標準計算機無法做到的事情。加速計算遠不止是一個芯片。 \"
英偉達還認為，人工智能的未來進步將由開源社區的貢獻推動。在演講后接受SiliconANGLE采訪時， Catanzaro指出Meta平臺公司、中國的阿里巴巴集團和DeepSeek都參與了Nemotron項目。
\"有很多很棒的貢獻， \"Catanzaro說。 \"Nemotron數據集正在被所有人使用。 \"
Catanzaro為人工智能的進步做出了自己獨特的貢獻。正如Stephen Witt關于英偉達崛起的書《思維機器》中所記錄的，創始人兼首席執行官黃仁勛將公司轉向人工智能的關鍵決定可以追溯到他與Catanzaro的互動，后者認為深度學習是人工智能未來的關鍵。
在與SiliconANGLE的對話中， Catanzaro描述了他在現場可編程門陣列（FPGA）方面的工作如何讓他欣賞英偉達基于GPU的CUDA計算架構的速度。他對該技術如何應用于人工智能很感興趣，并在2013年與黃仁勛討論了其在機器學習中的應用。
\"我看到了這一點，認為英偉達為CUDA帶來的編程有些特別， \"Catanzaro說。 \"當時， CUDA并不太專注于機器學習。它專注于高性能計算。那段旅程非常令人興奮......其余的就是歷史了。 \"
實現交互式人工智能
人工智能發展和崛起的歷史也要歸功于計算機科學家如Christopher Manning教授的影響。作為自然語言處理（NLP）領域的知名專家， Manning提醒BayLearn與會者， 20多年前，當計算語言學協會會議上展示了33篇人工智能論文時，大語言模型甚至不在許多科學家的視野中。
斯坦福大學的Christopher Manning教授在BayLearn會議上談論了他的NLP研究和人工智能。
\"1993年有多少大語言模型論文？\"Manning問道。 \"零篇。沒有后見之明，真的很令人驚訝沒有人在談論語言模型。我們顯然可以而且應該更早推動大語言模型。人們不相信大語言模型會有用。 \"
然而，事實證明有用的是基于人工智能應用的自然語言能力。 Manning在斯坦福大學的研究為深度學習在NLP中的應用鋪平了道路，這已成為人工智能在當今廣泛應用中增長和使用的基礎。
Manning是斯坦福人類中心人工智能研究所的創始人和副主任，他對當前專注于人工智能以獲得立即結果的做法表示沫喪，這種做法忽略了該技術通過與周圍世界的互動而變得更好的潛力。
\"大語言模型根本不能交互式工作， \"Manning說。 \"人類可以用比我們當前模型少幾個數量級的數據來學習。我們的人類學習比機器學習更好。 \"
根據Manning的觀點，解決方案是系統性泛化，這是人工智能模型超越當前行業解決方案的能力，這些解決方案用數據塞滿模型，進入智能體可以通過互動學習的世界。目標是創建將已知元素組合成新含義的人工智能模型。這將涉及構建一個通過\"瀏覽網站\"學習的系統，根據Manning的說法，通過探索變得更好。
\"在合理程度上，強力（數據）確實有效，但這不是人類的工作方式， \"Manning指出。 \"我們需要更高效的模型，可以實現系統性泛化。 \"
新的機器學習和機器人工具
對系統性泛化的追求將需要新的人工智能框架，這些框架能夠在計算網絡上更高效地運行。蘋果公司正在研究這樣的解決方案，通過增強MLX——蘋果芯片的機器學習軟件。
這個開源機器學習框架是蘋果為Mac計算機開發的。 MLX在近兩年前發布，可以將高級Python代碼轉換為優化的機器代碼。報告表明，蘋果還在與英偉達合作，為MLX添加CUDA后端支持，作為其減少構建機器學習框架成本努力的一部分。
\"我們認為這是構建針對硬件定制的機器學習軟件的機會， \"蘋果研究科學家Ronan Collobert在BayLearn聚會上說。 \"我們必須從系統角度思考如何可靠地部署人工智能。 \"
對于普通消費者來說，工程師對機器學習框架和編碼支持的熱情可能不會產生影響。然而，人工智能的進步也在以可能很快在我們周圍的世界中變得更加可見的方式改變機器人世界。
谷歌公司的DeepMind研究部門一直在努力開發旨在使機器人更智能的模型。上個月，該公司發布了其Gemini Robotics 1.5和E.R. 1.5模型，這些模型體現了推理能力，幫助機器人真正思考。
DeepMind的方法是之前為機器人配備執行單一任務的能力，比如折疊一張紙。現在它們能夠執行更高級的功能，比如根據預測的天氣條件選擇合適的衣服。
根據谷歌DeepMind研究副總裁Ed Chi的說法，人工智能正在推動通用機器人領域的進步，機器可以根據簡單的自然語言提示拾起物品并扔掉。這迫使工程師重新思考人工通用智能（AGI）使機器人能夠理解、學習并在無限范圍的人類任務中應用知識的宏偉愿景。
\"當我沒有一個能清潔我房子的機器人時，我厭倦了所有關于AGI的談論， \"Chi在會議小組會議期間說。 \"我們現在在機器人技術方面取得的巨大進步是在通用機器人領域。這已經足夠好了。 \"
\"足夠好\"確實可能成為人工智能領域開發者的口號，因為進步以光速發展，企業繼續要求立即見效。人工智能正在以令即使是最有經驗的從業者都感到震驚的速度推動社會和經濟變革。然而，也有一種信念認為，隨著人工智能能力的持續改善，影響將是巨大的。
\"我們目前生活在一個絕對非凡的時代， \"斯坦福的Manning說。 \"我們正走在一條將持續進步的道路上。我們將在這項技術的發展中經歷一段瘋狂的旅程。 \"
Q&A
Q1：Nemotron是什么？它在英偉達的發展戰略中扮演什么角色？
A：Nemotron是英偉達的開源人工智能技術集合，旨在使人工智能開發在每個階段都更加高效。它包括多模態模型和數據集、預訓練和后訓練工具、精度算法以及在GPU集群上擴展人工智能的軟件，是英偉達加速計算愿景的核心基礎部分。
Q2：大語言模型為什么沒有在早期得到重視？
A：據斯坦福大學Manning教授介紹， 20多年前在計算語言學協會會議上， 1993年關于大語言模型的論文數量是零。當時人們不相信大語言模型會有用，這種不信任導致研究者沒有更早推動大語言模型的發展。
Q3：谷歌DeepMind在機器人技術方面取得了什么突破？
A：谷歌DeepMind發布了Gemini Robotics 1.5和E.R. 1.5模型，使機器人具備推理能力和真正的思考能力。機器人從之前只能執行單一任務（如折紙）發展到現在能夠執行更高級功能，比如根據天氣預測選擇合適衣服，甚至能根據自然語言提示拾取和丟棄物品。
【人工智能研究新突破：英偉達、蘋果、谷歌和斯坦福探索下一步發展】

推薦閱讀

上一篇：Codeforces難題不夠刷？謝賽寧等造了AI出題機，能生成原創編程題

下一篇：通用人工智能和超級智能可能催生全新外星智能形態