Pokemon Go玩家拍了十年街景,現在AI用它來給機器人送外賣

Pokemon Go玩家拍了十年街景,現在AI用它來給機器人送外賣

文章圖片

Pokemon Go玩家拍了十年街景,現在AI用它來給機器人送外賣

(來源:麻省理工科技評論)

《Pokémon Go》是全球首個爆款增強現實游戲 。 2016 年 , Google 孵化公司 Niantic 推出了這款將 AR 技術融入《神奇寶貝》這一超級 IP 的作品 , 迅速席卷全球 。 從芝加哥到奧斯陸 , 再到江之島 , 玩家們紛紛走上街頭 , 滿懷期待地尋覓胖丁、杰尼龜 , 或是(極其幸運地)捕捉那只懸浮在現實世界中、觸手可及卻又遙不可及的超稀有洗翠雷鳥 。

這使得數以億計的人將手機鏡頭對準了無數棟建筑 。 “這款應用在 60 天內被 5 億人安裝 , ”Niantic 于去年 5 月分拆成立的 AI 公司 Niantic Spatial 的首席技術官布萊恩·麥克倫頓(Brian McClendon)說 。 據從 Niantic 手中收購《Pokémon Go》的游戲公司 Scopely 披露 , 2024年 , 這款游戲在發布整整八年后 , 月活躍玩家仍超過 1 億 。

如今 , Niantic Spatial 正在利用這批規模龐大、無可比擬的眾包數據來構建一種“世界模型”——畢竟 , 來自全球數億《Pokémon Go》玩家手機拍攝的城市地標圖像 , 并附有超高精度的位置標注 。 這是一種新興技術 , 旨在將大語言模型的智能能力與真實物理環境相結合 。

該公司最新推出的產品是一個模型 , 聲稱僅憑數張周邊建筑或地標的快照 , 便能將用戶在地圖上的位置精確定位至厘米級 。 公司希望將其用于在 GPS 信號不穩定的場景中 , 幫助機器人實現更精準的導航 。

作為技術的首次大規模實測 , Niantic Spatial 已與 Coco Robotics 達成合作 。 Coco Robotics 是一家在美國和歐洲多個城市部署“最后一公里”配送機器人的初創公司 。 “所有人都以為 AR 是未來 , 都覺得 AR 眼鏡即將到來 , ”麥克倫頓說 , “然后機器人成了那個目標用戶 。 ”


從皮卡丘到披薩配送

Coco Robotics 在洛杉磯、芝加哥、澤西城、邁阿密和赫爾辛基部署了約 1000 臺航空箱大小的機器人 , 每臺可搭載最多 8 個特大號披薩或 4 袋購物袋 。 據首席執行官扎克·拉什(Zach Rash)介紹 , 這些機器人迄今已完成逾 50 萬次配送 , 在各種天氣條件下累計行駛數百萬英里 。

然而 , 要與人類快遞員競爭 , 這些在人行道上以約每小時 8 公里的速度行進的機器人 , 必須達到極高的可靠性 。 “我們最好的服務 , 就是在承諾的時間準時到達 。 ”拉什說 , 這意味著不能迷路 。

Coco 面臨的問題在于 , 無法依賴 GPS 。 在城市中 , 無線電信號在建筑物之間相互反射干擾 , 導致 GPS 信號往往很弱 。 “我們在很多高樓林立、有高架橋和立交橋的密集區域送餐 , 而這些地方恰恰是 GPS 從來都不好用的地方 , ”拉什說 。

“城市峽谷是全球 GPS 最糟糕的場景 , ”麥克倫頓說 , “打開手機看那個藍色定位點 , 你會發現它常常漂移 50 米 , 把你定位到另一條街、另一個方向、馬路的另一側 。 ”這正是 Niantic Spatial 切入的地方 。

過去數年 , Niantic Spatial 持續整合《Pokémon Go》和 Ingress(Niantic 于 2013 年推出的上一款手機 AR 游戲)玩家貢獻的數據 , 構建了一套視覺定位系統——一種根據視野所見來判斷位置的技術 。 “讓皮卡丘真實地在現實世界中奔跑 , 和讓 Coco 機器人安全、精準地穿行于城市 , 本質上是同一個問題 。 ”Niantic Spatial 首席執行官約翰·漢克(John Hanke)說 。

“視覺定位并不是什么全新的技術 , ”地圖與地理空間分析軟件公司 ESRI 的康拉德·文澤爾(Konrad Wenzel)說 , “但顯然 , 外部攝像頭越多 , 效果就越好 。 ”

Niantic Spatial 用 300 億張城市環境圖像訓練了其模型 , 這些圖像高度集中于熱點地點——也就是 Niantic 游戲中鼓勵玩家到訪的重要場所 , 例如寶可夢對戰場館 。 “我們在全球擁有逾百萬個可對用戶進行精確定位的地點 , ”麥克倫頓說 , “我們知道你站在哪里 , 精度在幾厘米以內 , 更重要的是 , 我們知道你在看向哪個方向 。 ”

由此帶來的結果是 , 對于這百萬個地點中的每一處 , Niantic Spatial 都積累了數以千計的圖像 , 這些圖像拍攝地點大致相同 , 但角度不同、時段不同、天氣不同 。 每張圖像都附有詳盡的元數據 , 精確記錄了拍攝瞬間手機在空間中的位置 , 包括朝向、角度、是否在移動 , 以及移動速度和方向等信息 。

該公司以此數據集訓練了一個模型 , 讓其通過分析所見內容來精確判斷自身所處位置 。 即便是在那百萬熱點之外、圖像和位置數據相對稀缺的地點 , 同樣適用 。

除 GPS 之外 , 裝配了四個攝像頭的 Coco 機器人 , 現在還將借助這一模型判斷自身位置和前進方向 。 機器人攝像頭位于腰部高度 , 可同時覆蓋四個方向 , 與《Pokémon Go》玩家的視角略有不同 , 但拉什表示 , 數據的適配改造十分順暢 。

競爭對手同樣在使用視覺定位系統 。 例如 , 2014 年在愛沙尼亞創立的機器人配送公司 Starship Technologies 表示 , 其機器人會利用傳感器構建周圍環境的三維地圖 , 標繪建筑邊緣和路燈位置 。

但拉什押注 Niantic Spatial 的技術將為 Coco 帶來競爭優勢 。 他聲稱 , 這將使機器人能夠精準停在餐廳門外的指定取餐位 , 既不妨礙他人 , 又能停在顧客門前——而不是像過去有時那樣停在稍遠的地方 。


機器人領域的寒武紀?

漢克表示 , Niantic Spatial 最初開發視覺定位系統 , 是為了將其應用于增強現實 。 “如果你戴著 AR 眼鏡 , 希望虛擬世界與你所看的方向精確對齊 , 就需要某種方法來實現這一點 , ”他說 , “但現在 , 我們正在見證機器人領域的寒武紀大爆發 。 ”

這些機器人中 , 部分將需要與人類共享空間 , 例如建筑工地和人行道 。 “如果機器人要以不打擾人類的方式融入這些環境 , 就必須具備與人類相近的空間理解能力 , ”漢克說 , “我們能幫助機器人在被碰撞或推移之后 , 精確定位自身所在 。 ”

與 Coco Robotics 的合作只是開始 。 漢克表示 , Niantic Spatial 正在搭建的 , 是他所稱的“活地圖”的第一批基礎模塊:一幅隨世界變化而實時更新的超精細虛擬世界模擬 。 隨著 Coco 及其他公司的機器人在現實世界中持續移動 , 它們將不斷提供新的地圖數據 , 推動數字世界復制品的精度持續提升 。

在漢克和麥克倫頓看來 , 地圖不僅變得越來越精細 , 也越來越多地被機器使用 , 這從根本上改變了地圖的意義 。 長久以來 , 地圖的作用是幫助人類在世界中定位自身 。 從二維到三維 , 再到四維(如數字孿生體等實時模擬) , 這一基本邏輯從未改變:地圖上的點對應空間或時間中的點 。

然而 , 面向機器的地圖或許需要更像一本指南 , 充滿人類習以為常但機器需要明確告知的信息 。 Niantic Spatial 和 ESRI 等公司希望為地圖添加描述性標注 , 讓機器理解它們究竟在看什么——為每個對象打上涵蓋其屬性的標簽 。 “這個時代的核心任務 , 是為機器構建有用的世界描述 , ”漢克說 , “我們所擁有的數據 , 是建立世界運作脈絡理解的絕佳起點 。 ”

當前 , 世界模型正處于熱議之中 , Niantic Spatial 對此心知肚明 。 大語言模型或許看似無所不知 , 但在解讀和與日常環境交互方面 , 它們的常識極為匱乏 。 世界模型旨在彌補這一缺陷 。 Google DeepMind 和 World Labs 等公司正在開發能夠即時生成虛擬幻想世界的模型 , 并將其作為訓練 AI 智能體的演練場 。

Niantic Spatial 表示 , 自己從另一個角度切入這一問題 。 麥克倫頓認為 , 地圖制作推進到極致 , 最終會捕捉到一切:“我非常專注于重現真實世界 。 我們還沒到那一步 , 但那是我們的目標 。 ”

原文鏈接:
【Pokemon Go玩家拍了十年街景,現在AI用它來給機器人送外賣】https://www.technologyreview.com/2026/03/10/1134099/how-pokemon-go-is-helping-robots-deliver-pizza-on-time/

    推薦閱讀