黃仁勛也站臺的抱抱臉機器人賣爆了,背后公司竟來自中國

黃仁勛也站臺的抱抱臉機器人賣爆了,背后公司竟來自中國

文章圖片

黃仁勛也站臺的抱抱臉機器人賣爆了,背后公司竟來自中國

文章圖片

黃仁勛也站臺的抱抱臉機器人賣爆了,背后公司竟來自中國

文章圖片

黃仁勛也站臺的抱抱臉機器人賣爆了,背后公司竟來自中國

文章圖片

黃仁勛也站臺的抱抱臉機器人賣爆了,背后公司竟來自中國

文章圖片


henry 發自 凹非寺
量子位 | 公眾號 QbitAI
還記得Hugging Face去年推出的桌面機器人Reachy Mini嗎?
在剛發布的時候 , 量子位曾第一時間報道過這只身高28cm、體重1.5kg的“萌物”《抱抱臉進軍具身智能機器人:5小時成交破百萬 , 299美元起售》 。
而在過去的大半年的時間里 , 這款桌面開源機器人已經交出了一份頗為亮眼的成績單:
5天銷售額突破100萬美元、累計出貨3000臺以上 , 甚至還登上了黃仁勛的CES展臺 。

也正因如此 , 很多人第一次意識到——
那個被稱為“AI圈GitHub”的平臺 , 正在把開源哲學真正帶進具身智能世界 。
不過 , 很少有人注意到 , 在這款299美元起售的小機器人背后 , 還有一家中國公司參與了關鍵一環 。
它就是矽遞科技(SeeedStudio) , Reachy Mini正是由它打造 。
作為一家開源硬件平臺 , 矽遞并不是像宇樹那樣做整機產品的機器人公司 , 也不是主打某一款人形機器人的廠商 。
它在具身智能產業鏈里的角色 , 更像是一個硬件系統平臺型公司 。
一方面深度參與英偉達Jetson計算平臺生態 , 是英偉達的精英級合作伙伴;
另一方面 , 它也提供機器人大腦主控方案、電機關節、傳感器以及一系列開源機器人套件 , 服務于開發者與初創團隊 。
換句話說 , 當Hugging Face從模型平臺走向機器人硬件、當開源社區開始嘗試“軟硬結合” , 像矽遞這樣的公司 , 正在成為連接模型、硬件與開發者生態的重要節點 。

而在與矽遞科技AI機器人產品線的對話中 , 量子位也從一個少見的機器人硬件制造商視角 , 聽到了他們對具身智能產業的觀察與判斷:
AI陪伴與具身智能載體并不沖突 , 機器人的物理形態將會在一眾依賴屏幕的產品中脫穎而出 。 Reachy Mini桌面機器人的制造完全不同于人形機器人 , 難點包括聲學設計 。 低成本機器人未來的分水嶺不在于便宜 , 而在于可達性 。 對于具身智能開發而言 , 少即是多 , 過于復雜的自由度并不是必須 。 開源之于具身智能的意義在于降低門檻 。 單純的極限運動并不能被視為一個好的機器人demo , 一個好的demo應該是穩定、實時可互動的 , 而且能夠讓開發者基于此做進一步的延伸 。 遙操作是算法訓練的一部分 , 對于硬件本身來說 , 不能只關注性能和成本 , 還必須考慮與數據需求和訓練框架的適配性 。 數據驅動的具身智能范式正在重新定義硬件 ……以下是與來自矽遞的吳丹(機器人產品線負責人)和朱耀暉(機器人產品線應用工程師)的采訪實錄(在不改變原意的基礎上 , 有刪改):
Reachy Mini、開源硬件、制造商眼中的具身智能 Reachy Mini是什么?Q:如何給一個就是不了解機器人去介紹Reachy Mini , 它是一個怎樣的一臺機器人?目前最核心和最典型的能力是什么?
吳丹:Reachy Mini是一個高度開放的桌面的機器人 。
它具備完整的多模態交互能力:搭載攝像頭和麥克風 , 可以“看見”和“聽見” , 同時支持語音輸出與用戶對話 。
此外 , 它擁有九軸運動能力 , 頭部能夠做出動作反饋 , 通過姿態變化表達狀態與情緒 , 使互動更加自然生動 。
如果向一個不做機器人的人介紹Reachy Mini , 我會說它是一個可以放在桌面上、與大家互動的機器人 , 帶有一定娛樂和陪伴屬性 。
同時 , 因為它是開源開放的平臺 , 支持二次開發 , 所以應用場景會不斷擴展 。
另外 , 對于不做機器人 , 但了解大模型的(開發者)來說 , Reachy Mini的核心能力依然是多模態交互 。
它能夠聽、看、說 , 實現視覺、語音與動作的結合 。 同時 , 它可以連接Hugging Face上的各類大模型 , 支持靈活調用 , 也適合做智能體(Agent)開發 , 比如通過OpenClaw等方式接入 。
所以 , 即使不是做傳統機器人的開發者 , 對于算法工程師或偏軟件背景的開發者來說 , 它同樣是一個比較合適的平臺 。
Q:具體而言 , Reachy Mini是怎么進行交互的呢?
朱耀暉:Reachy Mini目前有兩個版本 。
一個是不帶主控的版本 , 用戶可以把它接入自己的筆記本電腦 , 或者連接到外部主控設備 , 比如Jetson、樹莓派 , 或者RK、地平線等芯片平臺 , 然后基于這些設備進行開發 , 或者體驗它原有的功能 。
另外一個是無線版本 , 內部自帶主控 , 采用的是樹莓派方案 , 開機之后就可以直接使用 , 不需要額外連接設備 。

關于定位:AI陪伴產品與具身智能載體并不沖突Q:作為一個一款桌面機器人 , Reachy Mini更應該被理解為一個AI+陪伴產品 , 還是一個具身智能的載體 , 你們更傾向于哪一種定位?
吳丹:我覺得它目前更偏向于一個具身智能的載體 。 因為它本身是一個開放平臺 , 核心是用來構建多模態機器人系統的 , 所以從定位上來說 , 它更適合做開發 。
不過 , 它現有的功能里確實也包含一部分陪伴屬性 。 所以我覺得這兩點并不沖突 。 只是因為它的開發屬性更強 , 對于開發者來說 , 它更像是一個具身智能的平臺 。
但從用戶層面來看 , 也有很多家庭用戶購買 。 比如有家長反饋 , 8歲的小朋友都可以自己把它搭建起來 , 并且玩得很好 。 對他們來說 , 它更像是一個陪伴型產品 。

所以我認為這兩種定位是同時存在的 。
如果用戶只是希望有一個陪伴型機器人 , 那它現有的功能已經足夠;如果是開發者想基于它去做智能體(Agent)或其他擴展開發 , 它也提供了充足的資源支持 。
Q:做陪伴型機器人通常會強調情緒價值 , 外觀也往往比較可愛 。 那Reachy Mini在設計和制造時 , 是否有特別考慮外形和“萌感”?
吳丹:有的 。 比如它的“大小眼”設計 , 就是一個比較萌的元素 。 另外 , 它頭上的兩個觸角——也就是天線——是可以動的 , 這也是一個增強可愛感的小細節 。
還有它下面那個圓圓的“大肚子” , 整體設計其實就是從比較萌的方向出發的 。
另外 , 因為它是開源的 , 用戶是可以自己改動外觀的 。 比如換顏色 , 或者做一些造型上的改造 。 之前PollenRobotics在萬圣節時 , 就把它改造成南瓜的樣子;

圣誕節的時候 , 也可以做成圣誕樹的造型 。

所以一方面 , 它本身的設計就比較可愛;另一方面 , 它也很容易被二次改造 。 只要通過3D打印 , 就可以對外觀進行個性化調整 。
Q:如果我買一臺Reachy Mini , 想通過3D打印給它做一些外觀配件 , 官方會提供相關教程或社區支持嗎?
朱耀暉:會的 。 我們后續會持續補充相關內容 。 它本身就會提供3D打印的設計文件 , 用戶可以基于這些文件進行打印和改造 。 我們也會在社區里逐步增加更多教程和設計示例 , 方便大家上手 。
Q:現在也有很多桌面AI產品 , 比如帶屏音箱、智能助手設備 , 它們同樣能提供陪伴體驗 , 但并不會把自己定義為“機器人” 。 為什么你們還是選擇機器人這種形態?在形態設計上 , 最重要的取舍是什么?
吳丹:這個問題其實PollenRobotics(Reachy Mini的設計團隊 , 被Hugging Face收購)團隊之前也談到過 。
他們認為 , 我們已經被各種屏幕高度包圍——iPad、手機、電腦 , 幾乎無處不在 。
這些設備里其實都已經有智能助手 , 但整體還是停留在“屏幕交互”層面 , 缺乏真正的參與感 。
相比之下 , 機器人形態能帶來更強的互動體驗 。 比如Reachy Mini里有一個emoji功能 , 當你觸發不同表情時 , 它會通過轉動腦袋、擺動觸角、配合聲音做出反饋 。
△圖源:推特網友Trtd6Trtd這種結合動作和聲音的表達 , 會讓人感覺它在“回應你” , 而不僅僅是屏幕上的一個界面變化 。
所以我覺得 , 這是人與技術之間互動方式的一種變化 。 PollenRobotics希望打造的是一種更有參與感、更具互動性、也更人性化的形態 。
他們認為 , 一個迷你機器人的形態 , 不僅要有吸引力 , 還要能夠傳遞信任感和好奇心 , 同時帶一點親和、可愛的特質 。 某種程度上 , 它是在技術感和親和力之間做了一個平衡 。
Q:它現在眼睛、頭部都可以活動 , 相比一般的桌面AI終端 , 可能會更耗電 。 那這款產品是需要一直插電使用 , 還是支持充電、無線使用?
吳丹:我們剛剛提到 , 它有兩個版本 。
其中一個版本是不帶主控的 , 需要接外部設備 , 比如Jetson或者用戶自己的電腦 。 這個版本是需要插電使用的 。
另一個是無線版本 , 內部自帶主控和電池 , 可以擺脫電源線 , 獨立運行 , 不需要一直插電 。
Q:有用戶在社交平臺分享 , 說買回Reachy Mini之后需要自己DIY拼裝、下載模型、部署環境 。 對很多非技術背景的人來說 , 這聽起來門檻不低 。 你們是如何在“可玩性”和“易用性”之間做平衡的?
吳丹:這個問題其實也和Reachy Mini設計的初衷有關 。 它最開始希望面向的是那些想探索開源機器人、尤其是希望嘗試把Agent智能體模型集成到機器人里的用戶 。 所以它既要有可開發性 , 也要兼顧娛樂和日常使用 。
在易用性方面 , 其實我們做了很多優化 。
用戶收到產品后 , 會發現安裝說明書非常詳細 , 整個組裝時間大概在2到3個小時左右 , 而且大部分結構已經預裝完成 , 真正需要自己動手的部分并不復雜 。
我之前提到過 , 8歲的小朋友都可以完成拼裝 , 所以整體難度并不高 。 某種程度上 , 它反而成為一個很好的親子互動或者朋友一起動手的過程 。
另外 , 在軟件層面 , 它也提供了很多“開箱即用”的應用 。
安裝完成之后 , 會有一個可視化UI界面 , 用戶可以直接點擊體驗 。 Hugging Face和PollenRobotics也已經準備了不少示例應用和教程 , 幫助用戶快速上手 。

至于可玩性 , 如果是開發者用戶 , 我們也非常歡迎他們深度參與 。
比如可以接入OpenClaw , 做成語音助手;也可以接入Home Assistant , 變成家庭智能家居的管理入口 。
這樣一來 , Reachy Mini就不僅僅是一個桌面機器人 , 而是可以融入家庭或辦公場景 。
像在今年CES上 , 黃仁勛演講中Hugging Face展示的一些Demo , 比如 , 詢問Reachy Mini計劃 , Reachy Mini 可以根據看到的計劃表 , 再通過語音或者本地界面發給用戶 , 這類能力都可以通過多模態大模型接入進來 。

所以我們希望它既能讓普通用戶輕松體驗 , 也能給開發者足夠空間去發揮 。 它的可玩性 , 其實來自于這些開放接口和多模態能力的結合 。
它是可以融入到家庭或者是辦公的一些場景的 , 結合的技術點會非常的多 , 就是剛剛提到的OpenClaw多模態的大模型、大語言模型 , 還有Home Assistant智能家居的系統 。

Q:它既然可以融入家庭場景 , 那重量怎么樣?無線版本可以隨手拎著走嗎?
朱耀暉:它其實不重 , 不像市面上一些人形機器人那樣需要固定擺放 , 是可以移動的 。
大概相當于一臺筆記本電腦的重量 。 它的外殼大部分是塑料件 , 內部只有少量金屬結構和舵機組件 , 所以整體不會太重 。 基本上單手就可以拿起來 , 無線版本也可以隨手移動 。
桌面機器人制造中的難點Q:像Reachy Mini這種桌面級小機器人 , 在制造過程中面臨的挑戰是什么?未來優化方向在哪里?
朱耀輝:Reachy Mini這種小型桌面機器人 , 挑戰和大型人形機器人不完全一樣 , 其中一個非常復雜的挑戰其實來自聲學設計 。
因為它在執行動作時 , 多個電機會同時運轉 , 舵機齒輪嚙合會產生明顯機械噪聲 。 而它又是一臺需要和人對話的機器人 , 麥克風陣列必須在運動狀態下仍然保持清晰拾音 。
所以我們和Hugging Face以及PollenRobotics一起 , 通過反復聲學實驗 , 從結構設計到算法層面做了聯合優化 , 提升整體降噪能力和音頻表現 。
最終在我們自研的ReSpeaker麥克風陣列上實現了更穩定清晰的語音體驗 。 這個麥克風陣列本身就帶有降噪算法 , 再結合結構減振和算法濾波 , 才解決了“邊動邊聽”的問題 。 這其實是桌面交互機器人非常核心的難點 。
另外一個現實問題是算力和網絡依賴 。 Reachy Mini本身需要聯網來調用大模型 。 即便使用類似樹莓派這樣的本地計算平臺 , 如果要調用云端模型 , 網絡環境依然很重要 。
所以我們也在探索邊緣部署的可能性 , 比如基于NVIDIA平臺做本地推理優化 , 讓部分能力能夠在邊緣側完成 , 從而降低延遲和對網絡的依賴 。
Q:我有一個比較基礎的問題 。 語音模型到底是怎么運作的?是我說一段話 , 它完整聽完再反饋嗎?如果很多人在同時說話 , 它能區分指令嗎?敲門聲這種非語言聲音它會不會誤識別?它是怎么處理這些情況的?
朱耀暉:語音識別系統其實做了多層過濾 。 在嘈雜環境中 , 它會通過算法提取“概率最高”的那個人聲信號 , 也就是主說話人的語音 , 然后盡量排除背景干擾 , 比如多人說話、環境噪聲、敲門聲等 。
我們在聲學實驗室做了大量噪聲測試 , 包括環境噪聲測試和機器人自身運動噪聲測試 。 Reachy Mini在運動時 , 舵機齒輪嚙合聲是最大的挑戰 , 因為那是持續、結構性噪聲 , 會干擾語音識別 。
這個問題一開始確實影響很大 , 后來通過不斷結構優化、算法調校和降噪策略疊加 , 才打磨出現在這個版本的聲學效果 。
Q:如果說話快慢不同 , 它能跟得上節奏嗎?輸出延遲有沒有專門優化?
朱耀暉:這個和所用的大模型有關 。 它可以切換不同模型 。
有些模型參數大、推理時間長 , 響應自然就慢一些;有些模型是輕量級的 , 響應速度很快 , 但準確率可能稍微低一點 。
【黃仁勛也站臺的抱抱臉機器人賣爆了,背后公司竟來自中國】比如切換到國內一些小參數模型 , 輸出會非???, 但理解能力可能不如大模型強 。 這本質上是速度與準確率之間的權衡 。
它可以自行切換模型 , 包括國產模型和開源模型 , 都可以部署 。
具身智能開發 , 少即是多Q:現在不少機器人廠商會做類似“應用商店”的平臺 , 用戶可以直接下載動作或功能 。 相比那些能翻跟頭、跑跳的人形機器人 , Reachy Mini自由度相對有限 。 在動作能力不那么“炫酷”的情況下 , 你們如何發揮它的優勢 , 創造不同的玩法?
吳丹:您提到的那些能完成復雜動作的人形機器人 , 確實越來越強大 , 看起來也很震撼 。 但從開發者學習和入門的角度來說 , 我反而覺得“少即是多” 。
很多復雜動作 , 其實是通過精細編排的動作序列實現的 , 它們更偏向運動控制和硬件能力的展示 。
而Reachy Mini , 包括我們之前在Hugging Face上推動的一些機器人項目 , 更強調端到端的學習和執行能力 , 讓機器人結合大模型去完成交互和決策 。
如果在Reachy Mini上增加手、腿或者底盤結構 , 系統復雜度、開發成本和售價都會顯著提升 。
它現在的定位 , 是希望以相對可負擔的價格 , 讓更多人不管年齡、職業或技術背景都能接觸具身智能 。 如果走向高復雜度的人形形態 , 價格可能會上萬 , 那就偏離了它降低門檻的初衷 。
當然 , 它目前的形態確實不能翻跟頭、不能行走 , 但通過舵機驅動的頭部和觸角動作 , 已經可以完成大部分情緒表達和互動體驗 。
當然底盤和手 , 你想加的話也可以 。 但是基于它現在的一個產品的一個形態 , 我覺得它大部分的交互體驗已經可以完成 。
對于學習機器人原理、做軟件和智能體開發來說 , 這樣的復雜度是足夠的 。 更高的復雜度 , 往往意味著更高的成本和更高的門檻 。
市面上那些能跑能跳的人形機器人 , 核心在于運動控制能力 , 強調電機性能、步態算法和動作編排的流暢度 。
而Reachy Mini更偏向讓用戶體驗大模型、Agent , 以及像OpenClaw這樣的能力接入 。
未來它更多是融入家庭或辦公場景 , 比如接入智能家居系統 , 做陪伴或管理功能 。 所以我們更強調軟件和應用層面的開發 , 而不是極限運動能力 。
另外 , 關于類似“應用商店”的模式 , Reachy Mini其實也在做 。 Hugging Face已經提供了一個類似應用市場的界面 , 用戶可以直接下載并部署現成的功能 。
社區的用戶開發完一定的功能以后 , 也能上傳到Hugging Face的社區 。 用戶點擊下載 , 就可以直接體驗到其他人開發這個功能 。
低成本機器人的分水嶺不在價格 , 在可達性Q:現在越來越多團隊在做低成本、開源機器人 , 包括一些幾百到一萬元以內的小型四足或人形機器人 。 你們怎么看“低成本”的分水嶺?是價格、能力、生態 , 還是使用門檻?未來隨著人形機器人越來越便宜 , 像Reachy Mini這種桌面機器人會如何定位和發展?
吳丹:低成本真正的分水嶺不只是價格 , 而是“可達性”(accessible) 。
如果希望具身智能真正發展 , 首先要讓機器人更容易被接觸、被使用 。 當然 , 價格低是一個重要前提 , 但它不是唯一標準 。
早期階段 , 最關鍵的是開發者能否真正用起來 。 平臺是否易于開發、足夠開放、具有靈活性 , 這些都比單一價格更重要 。
如果只是價格低 , 但系統封閉、擴展性差、交互能力單一 , 那很難吸引更多創新力量加入 。 相反 , 如果平臺足夠開放 , 就可以吸引更多人參與 , 一起推動行業生態的繁榮 。
以Reachy Mini為例 , 它雖然是桌面形態 , 但具備擴展能力 , 比如可以加底盤、加手臂;在軟件層面 , 也可以持續接入新的模型和能力 。 這種軟硬件上的擴展性 , 會帶來更長期的生命力 。
從行業趨勢來看 , 我認為機器人價格一定會越來越有競爭力 。 隨著供應鏈成熟、規?;慨a , 以及前期試錯逐漸完成 , 很多技術會趨向標準化 , 成本自然會下降 。
但在現階段拉開差距的 , 更多是開發友好程度和生態完整度 。 Reachy Mini作為一個全開源產品 , 在這方面是有優勢的 。
另外 , PollenRobotics也一直強調 , 一個“好看”或者“動作炫酷”的機器人遠遠不夠 。
即使價格不錯 , 如果缺乏可用性和用戶基礎 , 會面臨很多挑戰 。 因為具身智能最早的一批用戶一定是開發者 , 他們會把機器人真正帶到工廠、家庭或商業場景中 。 所以產品是否對開發者友好、是否容易落地 , 比單純展示能力更重要 。
同時 , 社區的力量非常關鍵 。 這也是我們堅持開源的原因 。 用戶不僅可以基于它開發自己的應用 , 還可以在社區中交流、共享成果 。 這樣產品才會不斷進化 , 成為生產力 。
Q:我這樣理解對不對——如果一個機器人很貴 , 買的人少 , 開發者基數也小 , 那作為用戶 , 可能就看不到太多技術文檔或新的玩法分享;反過來 , 如果機器人便宜 , 買的人多 , 社區活躍 , 我就能從更大的用戶基數中受益 。 可以這么理解嗎?
吳丹:這個理解不完全準確 。
價格高 , 確實會阻礙一部分人購買 。 不是每個人都能負擔十萬元級別的機器人 , 這一點是現實問題 。
但價格低 , 本身并不是決定性分水嶺 。 因為如果一個產品只是便宜 , 卻不開放 。 文檔不完整、軟硬件生態封閉、二次開發不方便 , 那開發者其實也很難基于它做創新 。
所以關鍵不只是便宜 , 而是開發體驗要足夠好 。 要開放、可拓展 , 讓開發者真正愿意用它、改它、分享成果 。
簡單來說 , 光便宜還不夠 , 還需要開放性和擴展性 。 只有這樣 , 社區才會自然成長 , 生態才會形成正循環 。
開源機器人最大的價值 , 是降低參與門檻Q:Reachy Mini是一個非常開源的機器人 , 那么在你們看來 , 開源對機器人社區 , 尤其是具身智能社區 , 最大的價值是什么?
吳丹:我覺得開源機器人最大的價值 , 是降低參與門檻 。
具身智能仍然是一個非常新的領域 。 雖然現在越來越多的機器人開始標準化、量產化 , 但它的發展依然高度依賴更多人參與實驗、驗證想法、不斷迭代和創新 。 這種開放式的參與 , 本身就是推動領域進步的重要力量 。
在矽遞 , 我們整個AI機器人產品線都秉承這個理念——讓具身智能的開發門檻更低 。 這個“門檻低”體現在幾個方面 。
首先是產品層面 。 我們提供多種類型、經過工程師嚴選和驗證的產品方案 , 讓開發者可以直接在可靠基礎上開發 , 從而縮短研發周期 。
其次是時間成本 。 開發者不需要從零開始踩坑 , 可以站在已經驗證過的硬件和系統之上 , 把精力集中在創新本身 。
再者是價格 。 具身智能除了比較貴的工業機器人 , 還要有大眾能夠接受的、價格相對可接近的機器人 。
另外還有教育資源 。 我們提供教程和課程 , 讓不同技術背景的人都可以參與進來 。
像Reachy Mini , 或者Hugging Face在LeRobot框架下的一系列機器人 , 其實讓開發者、研究者、學生能夠完整理解從硬件到軟件再到AI模型的整個技術棧 。 它提升了透明度和可復現性 , 也加快了創新節奏 。
比如Reachy Mini , 從組裝那一刻起 , 你就能看到它的控制單元、感知單元、推理單元 。 你不僅理解“它能做什么” , 而是理解“它是怎么做出來的” 。
開發者可以在示例模型基礎上接入自己的模型 , 或者接入其他先進模型 , 真正體驗完整的技術棧 。
同時 , 在我們CEO潘昊以及Matthieu Lapeyre(PollenRoboticsCEO)之前的訪談中也強調過 , Reachy Mini的設計理念就是開放和簡潔 。
它采用白色外殼設計 , 方便快速個性化改造;軟件棧與Hugging Face深度集成 , 開發者只需要幾行Python代碼就可以部署AI應用 。 甚至隨著工具的進步 , 很多時候通過更高層級的接口 , 就能完成部署 。
Q:對于做大模型的人來說 , 他們會說開源在某種程度上和企業利潤是有沖突的 。 那回到機器人領域 , 做開源會不會和盈利產生矛盾?如果你把東西開源了 , 大家覺得是“免費的” , 那企業怎么賺錢?
吳丹:首先 , 開源并不等于沒有商業模式 。
在開源機器人中 , 零部件清單是公開透明的 , 大家大概知道成本結構 。 但企業之間仍然存在供應鏈能力的差異 , 包括成本控制能力、規?;芰驼夏芰?。
同時 , 像Reachy Mini這樣的產品 , 本質上并不是一個“只為盈利”的產品 。 它的首要目標是讓更多開發者參與進來 , 建立社區 , 而不是賺一波錢就結束 。
當然 , 它也不能長期虧損 。 任何產品都需要一個可持續的模式 。 但Reachy Mini的優先級排序 , 不是“利潤最大化” , 而是“生態構建優先” 。
我們Seeed也是一家開源硬件公司 , 我們很理解Hugging Face做開源機器人的初衷 。 我們很多產品 , 包括圖紙和PCB , 都是開源的 。
我們的想法是:通過開放、驗證過的方案 , 幫助初創公司或個人團隊節省前期開發成本 。 等他們基于我們的方案做出了產品 , 進入量產階段 , 自然會回來尋找我們合作量產 。
也就是說 , 開源不是終點 , 而是一個生態入口 。 社區用戶在我們平臺上創新 , 最終又反哺企業 , 形成長期合作關系 。 這是我們一直堅持的方式 。
制造商眼中的具身智能Q:你們覺得機器人硬件未來會像PC一樣走向標準化嗎?還是會根據不同場景、不同任務 , 發展出很多不同形態?
吳丹:我覺得這兩種趨勢會同時發生 。
因為這個行業現在仍然處于非常早期的階段 。 在這個階段 , 比起急著完全標準化 , 更重要的是保持開放 , 降低門檻 , 讓更多開發者進入這個領域 。
隨著生態逐步成熟 , 技術棧中的底層模塊一定會趨向標準化和模塊化 。 比如語音識別、感知算法、算力平臺 , 以及更穩定可靠的基礎模型 , 這些都會慢慢形成通用模塊 。
在矽遞 , 我們也是從整體系統架構的角度來推薦產品方案 , 從感知、控制到推理 , 構成一個完整技術棧 。 底層模塊未來一定會越來越標準化 。
但在應用層面 , 產品形態一定會保持多樣化 。 因為場景差異非常大 。 學校、家庭、醫院、辦公環境 , 每個場景的任務目標、交互方式、物理空間都不同 , 對機器人結構和系統設計的要求自然也不同 。
我覺得Reachy Mini作為一個開放的平臺 , 就是也是為了承載這些應用去設計的 , 而開發者可以在一個共享的一個基礎上進行實驗構建 , 并且探索不同的具身智能的一個場景 , 這個平臺從軟件到硬件都是可以共享的 。
Q:那我追問一個問題 , 就是咱們現在最主要的這個場景是什么呢?
吳丹:現在最主要的還是語音交互 。
用戶可以直接和它對話 。 同時 , 它可以結合視覺能力 , 比如讓它描述它面前看到的東西 , 然后圍繞這個視覺信息繼續對話 。
我們也在嘗試讓它接入更復雜的能力 , 比如類似OpenClaw這樣的系統 , 讓它在對話中不僅能回答問題 , 還能幫你生成內容 , 甚至觸發具體動作 , 比如執行某個指令 。
所以 , 目前主要是桌面場景 , 尤其是在辦公環境中 , 就是放在桌面上進行交互 。
Q:對于硬件制造商而言 , 什么樣的具身智能demo是好的?如何定義一個好的任務?
吳丹:在我看來 , 一個好的Demo , 首先必須是穩定、實時、可互動的 。
就是它的互動是不是流暢的?他是不是穩定去運行的?穩定就代表著說他是不是就做了一個這個動作 , 以后就不能復現了?
第二 , 它不只是展示技術或硬件實力 , 而是要讓開發者能夠基于這個Demo繼續延伸 。
我并不認為只展示極限運動或復雜動作就是“好的機器人” 。 其交互能力、感知能力、理解能力 , 以及視覺、語音和關節協調響應能力是更重要的 。
我們也和PollenRobotics討論過這個問題 。 他們的觀點是:真正重要的不是“機器人翻了一個跟頭” , 而是人們是否理解它是怎么翻起來的 。
如果你只是看到一個炫技動作 , 但完全不知道系統如何運作 , 也不知道如何控制或停止它 , 那這種體驗反而會帶來距離感 , 甚至不安全感 。 沒有人愿意面對一個不可控、不可理解的機器 。
安全性和可控性是非常重要的 。 比如我們在機械臂設計中 , 會加入懸?;蚓o急停止按鈕 , 讓人始終擁有控制權 。 這種設計本身就是一種信任構建 。 對于人形機器人來說 , 這種安全考量就更加關鍵 。
這也是為什么Reachy Mini的組裝過程很重要 。 你不是只看到它做可愛的動作 , 而是親手參與搭建 , 理解它的結構和原理 。 當你知道背后發生了什么 , 再去看它完成一個任務 , 那種感受是不一樣的 。
我認為 , 一個好的演示只是起點 。 通過親自動手搭建機器人 , 用戶不僅能夠親眼見證它如何出色地完成任務 , 更能深入理解其背后的運行原理 。 這個從動手實踐到獲得反饋的過程 , 還會自然地建立起人與機器之間的信任感 , 增加互動的深度 。 這種體驗 , 遠比單純觀看演示更有意義 。
數據范式如何定義硬件Q:現在很多人說具身智能硬件已經OK了 , 軟件還不行?你們怎么看這種觀點?
吳丹:在硬件的角度 , 我們一直在隨著算法更新 。
在機器人上 , 硬件和算法非常重要 , 但算法前期需要數據積累 , 所以現在大量的遙操作 , 其實本質上是在為算法鋪路 。 很多規?;臄祿S正在建立 , 專門做數據采集 。 遙操其實是算法訓練階段的一部分 , 而數采非常重要 。
同時 , 因為數據非常重要 , 也出現了專門為數據采集設計的硬件 , 而隨著數據越來越多 , 模型也會越來越穩健 。
這就是我們制造商對模型的看法 , 對于硬件本身來說 , 我們不能只關注性能和成本 , 還必須考慮與數據需求和訓練框架的適配性 。
比如我們剛剛推出的一款全開源六軸機械臂(Seeed reBot-DevArm) , 它是電機版本的 , 已經適配了Hugging Face的LeRobot框架 。 這樣它就可以更自然地融入標準化的數據采集和訓練流程 。

這其實也是硬件標準化的一部分 。 隨著模型和數據格式逐漸趨于標準 , 硬件接口也會向這種標準靠攏 。
另外 , 現在不僅是真實數據重要 , 仿真數據也越來越關鍵 。 例如英偉達GR00T這樣的基礎模型 , 就融合了多種數據來源:真實采集數據、仿真數據以及視頻數據 。 多源數據融合能讓模型更穩健 。
所以在矽遞這邊 , 我們也會支持類似Isaac Sim這樣的仿真生態 。
讓開發者既可以在真實環境中用我們的設備做數據采集 , 也可以在仿真環境中做規?;柧毢蜏y試 。
然后所以就整體來說 , 我覺得硬件制造商要更注重開放性和接口設計 , 然后以及生態的兼容性 , 應該確保對數據和模型的一個這樣的需求 。
整體來說 , 數據和模型它肯定是分不開的 , 兩者互相決定 。
Q:我還是有一個困惑 。 之前很多論文都提到 , 不同硬件采集出來的數據是不一樣的 , 還涉及跨本體的問題 。 你剛剛說硬件會越來越標準化 , 數據也會更容易共享 。 但另一方面 , 硬件形態又會很多樣 。 那多樣性和標準化怎么同時成立?我有點沒理解這個過程 。
朱耀暉:多樣性其實就像采集數據集 , 它是想從a點搬運到b點人為遙操的時候 , 這個人的行為習慣和下一個人的行為習慣可能是不一樣的 , 這就是它的多樣性 。
就像網上的一些數據 , 是不同形態的機械臂或者機器人 , 它們做一些動作的時候 , 它其實是不一樣的路徑或者風格 , 這就是多樣性 。
那么標準化其實就是說他們把這數據集采集到本地電腦上 , 實實在在能看到的數據格式 , 大家都會統一這樣一個標準 。
就是說我可以用我的算法直接訓練你的數據集 , 而不需要再去進行一個一層轉換 , 這就是標準化 。
然后就像現在Hugging Face推出那個LeRobot那個框架 , 他們就是把所有的一些硬件接口、數據接口進行了標準化 。
松靈、OpenArm等開源硬件 , 只要接口符合規范 , 就可以直接接入生態 。
在數據集層面 , Hugging Face也推出了統一規范版本的LeRobot4.0的數據集格式 。 開發者可以把自己的數據轉換成這個標準格式 , 然后就能直接在不同硬件上部署或訓練 , 這就打通了所有的硬件軟件層面的差別 , 這就是他們的標準化做的一個非常大的貢獻 。
所以多樣性是數據軌跡和姿態層面的差異 , 而標準化是數據格式統一 , 大家可以直接使用 , 不需要轉換 。
Q:具身智能中分工和全棧哪個更有未來?基于數據范式出現的專門制作數據的公司意味著什么
吳丹:我個人認為 , 這兩種形態都會存在 。
全棧公司通常是圍繞自己的產品去做的 。 比如做醫療機器人 , 它是直接面向行業的解決方案 , 那一定要對醫療領域有一個自己的解決方案 。
但同時 , 我也認為一定會有分工的流水線 。 比如專門做某些場景數據的團隊 , 會做醫療、家庭等特定場景的數據采集 。
剛剛你提到的數采類數據 , 和真正用于訓練的機器人數據其實還是有區別的 。
比如光輪智能 , 他們就是專門做仿真數據的 。
仿真數據的優勢在于 , 在保證精度的同時更容易獲得 。 因為不是所有團隊都有條件用硬件去做大規模真實采集 , 真實數據采集非常耗時 , 人力成本也很高 。
我剛剛也提到 , 像一些大模型 , 比如英偉達的GR00T這一類 , 它們通常會融合不同來源的數據:真實場景數據、仿真數據 , 還有視頻數據 。 不同數據類型結合在一起 , 效果會更好 。
所以我覺得未來一定會出現這種分工流水線 , 類似模塊化 , 比如做數據的公司專門就做數據 , 這個環節本身就在加速整個具身智能的開發 。
但對于全棧公司來說 , 就要看它是不是只聚焦某一個落地場景 。 如果是單一場景 , 比如只做醫院或者零售 , 它就需要對那個場景有非常深入的理解 , 這種情況下 , 全棧是有優勢的 。
而在模塊化、流水線層面 , 通過分工和標準化數據 , 是可以實現整體加速的 。
Q:所以可以理解為 , 在模型訓練端會需要不同的數據“配方” , 包括仿真數據、真實數據、視頻數據等;對應到產業層面 , 就會出現專門的數據工廠負責采集或生成這些數據 , 從而形成更明確的分工 , 加速行業發展 。 而對于一些需要強場景落地的公司 , 它們會更傾向于圍繞特定場景構建自己的數據體系 。 是這樣嗎?
吳丹:(是的)
Q:過去一年具身智能融資和項目大量出現 , 幾乎每天都有新公司冒出來 。 很多人說2025年是量產元年 , 那我們現在到底處在一個什么時間節點?今年會出現怎樣的發展?
吳丹:我覺得它仍然是一個早期階段 , 但是今年我相信一定會看到越來越多的參考設計出現 。
你剛剛提到2025年是量產元年 , 我覺得這意味著行業已經進入從概念走向方向逐步清晰的過渡階段 , 它已經不再只是停留在概念階段 。
所以我認為 , 越來越多的參考設計會依托于社區和行業的發展出現 。
社區里、行業里會有更多公司開始認真做產品 。 但這個行業一定還會有變化 , 所以我覺得無論是我們制造商 , 還是作為硬件平臺 , 都要保持一個長期視角 , 去接受早期開發者這個階段的狀態 。
我們剛剛也聊到模塊化 。 模塊化會越來越趨向標準化 。 我覺得現在正是建立產品化能力和模塊化能力的關鍵時期 。
包括我們自己產品的一些開源設計 , 比如機械臂、靈巧手、主控設計、感知模塊選型等 。 同時我們也要加強成本優化、量產能力以及生態協作 。
生態協作就是剛剛提到的 , 我們如何更高效地和模型結合 , 如何和機器人生態 , 比如像ROS這樣的生態去結合 。 我覺得從社區、硬件到軟件的同時加速 , 最終是為了推動商業化 , 加速商業化 。
Q:那回到你們公司本身 , 你們在具身智能生態里處在一個什么位置?
吳丹:我覺得我們在具身智能的開發者生態里面 , 是一個比較有特點的平臺 。
首先從產品線來說 , 剛剛也提到 , 我們是從整個機器人系統的角度去給大家提供產品 。
在主控 , 也就是機器人最重要的“大腦”層面 , 我們是英偉達的精英級合作伙伴 。
同時 , 在英偉達的開發者生態里我們也非?;钴S 。 我們有很多課程、教程 , 也提供開發者一鍵部署的能力 。 所以整體來說 , 我們是一個比較新興、先進 , 而且非?;钴S、對開發者友好的平臺 。
在機器人方向上 , 我們也提供了很多新的內容 。 比如像LeRobot這樣的框架 , 很多早期想接觸具身智能的開發者都會知道 。 它在GitHub上已經有兩萬多星 , 是一個影響力很大的開源框架 。
我們在這個生態里推出了很多配套的套件、教程和產品 , 讓開發者可以更快上手 。
所以對于早期想進入具身智能領域的開發者來說 , 矽遞是一個能夠提供比較完整產品體系和完整教程支持的平臺 。
我們不會簡單用“市場占有率”或者“單一產品做得最好”來定義自己 。 矽遞本身是一家開源硬件公司 。 在AI機器人這條產品線上 , 我們的核心目標是降低具身智能的開發門檻 。
在這一點上 , 我認為我們做得是比較好的 。 我們在開發者生態里足夠活躍 , 也在持續給大家帶來新的、有趣的、可實踐的開發內容 。
Q:那最后一個問題 , 什么是開源硬件?
吳丹:簡單來說 , 開源硬件就是用戶可以基于開放的硬件和軟件層來學習和二次開發 。
在矽遞 , 我們的使命是讓科技隨手可得 。 我們專注于為全球創客、開發者及科學家等創新者提供邊緣AI、機器人及智能傳感器系統等新興技術 ,賦能每一位創新者實現數字化轉型 。
— 完 —
量子位 QbitAI · 頭條號簽約
關注我們 , 第一時間獲知前沿科技動態

    推薦閱讀