
以前的人工智能神經網絡 , 往往“分工明確”、“用情專一” , 訓練一類數據集只能推理完成一類任務 , 對其他類別的任務愛莫能助 。 原來的AI預訓練模型也是如此 , 自然語言處理只搞自然語言處理 , 計算機視覺只搞計算機視覺 , 機智客覺得 , 雖然隨著技術發展 , 后來的大模型“打破世俗的偏見” , 開始跨界 , 多模態成為新的技術風向 , 比如可以用于NLP的還可以用于CV 。 不過多數情況下 , 還是一個蘿卜一個坑 , 特定的AI有特定的應用 , 難有通用AI 。
而現在 , 人工智能界的扛把子DeepMind似乎將通用人工智能向前推進了一步 。 他們推出了一款新的具備通才的AI智能體Gato , 說它具備通才 , 是因為它受大規模語言建模的啟發而構建 , 具有多模態、多任務、多具身(embodiment)特點 。
具體一點就是 , 這個被成為Gato的AI智能體 , 不僅能作用于游戲——比如玩雅達利游戲 , 而且還能作用于圖像——比如給圖像添加字幕;不僅能作用于NLP——比如用來聊天 , 而且還能作用于操作——比如用機械臂堆疊積木 。 可謂一次訓練 , 到處使用 。
而且在細化一點 , 具體到玩游戲 , Gato也不僅僅只能玩一種游戲 , 它雖然采用相同的訓練模型 , 然而卻跟有腦子一樣的人一樣 , 能玩轉多種游戲 。 切換到這個游戲 , 能玩 , 再切換到另外不同的游戲 , 依然能玩 。 這個是不是有點酷呢?
那么這么酷的AI是怎么訓練出來的?據了解天生具備多種模式的它 , 訓練當然也需要包括不同模態的數據 , 如圖像、文本、本體感覺(proprioception)、關節力矩、按鈕按壓以及其他離散和連續的觀察和行動 。
而多模態數據集 , 畢竟千差萬別 , 不是同類 , 所以并不能直接使用 , 而是從數據序列轉化為一個扁平的token序列 。 而在這個扁平的序列中 , Gato則是從類似于標準的大規模語言模型進行訓練和采樣 。 而在部署過程中 , 它可以根據上下文組合成對話響應、字幕、按鈕按下或其他動作 。 這也是它為什么會操作機械臂執行各種連續的動作的一個原因 。
總而言之 , DeepMind這款AI智能體 , 不再像以前那樣由單一的同類訓練集訓練執行單類的任務 , 而是博采眾長 , 糅合多種AI領域 , 比如強化學習啦計算機視覺啦自然語言處理啦 , 有機結合到一塊 , 映射到同一的空間用于同一套參數來表達 , 不可謂不厲害 。
【deepmind|通用人工智能更近了?DeepMind通才AI智能體能游戲聊天用機械臂】雖然這款AI智能體的參數量并不多 , 算是試水之作 , 不過很顯然它提供了一個思路 , 證明了可以將CV、NLP乃至RL結合起來 , 機智客覺得這也許是為以后的人工智能技術發展提供了一個新的探索方向吧 , 或許以后新的技術分支和更“聰明”的AI正在孕育 。 讓我等升斗小民一起等待新的技術突破吧 。
相關經驗推薦
- 芯片|中國人工智能芯片行業發展現狀
- 內存條|電腦要有多大的內存夠用?內存到底是什么,普通用戶用不了多少
- |借助人工智能 幫助聽力障礙人群重獲新生 訊飛智能助聽器體驗分享
- 柯基犬|陳根:柯基被當成“電驢”?人工智能成人工智障
- gps|拋棄GPS,密林中通過人工智能實現蜂群無人機自主穿越,超越美國
- |人工智能--軍事領域的新一代決定性致勝技術
- 徐波|人工智能,未來長這樣
- 健康碼|教你1s快速打開“健康碼”與“核酸碼”,華為、安卓、蘋果手機通用教程
- |科睿自學:人工智能專業
- 微波爐|真實上演!微波爐獲得人工智能“靈魂”后,竟試圖謀殺創造它的工程師
