兩個95后華人,搞出硬件版Clawdbot,售價1700元

兩個95后華人,搞出硬件版Clawdbot,售價1700元

文章圖片

兩個95后華人,搞出硬件版Clawdbot,售價1700元

文章圖片

兩個95后華人,搞出硬件版Clawdbot,售價1700元

文章圖片

兩個95后華人,搞出硬件版Clawdbot,售價1700元

文章圖片

兩個95后華人,搞出硬件版Clawdbot,售價1700元

Jay 發自 凹非寺
量子位 | 公眾號 QbitAI
OpenClaw(原名Clawdbot)爆火 , 「賈維斯」狂潮席卷全球 。
剛看了下京東 , 本地Agent甚至已經成了Mac mini的廣告語……

最近硅谷的一個本地Agent項目也很有關注度 , 而且是軟硬件打包好 , 買回來就能直接用的那種 。
長這樣子 , 賣250美元(折合人民幣約1700元) , 買來插上電就能當OpenClaw用 。

對 , 硬件版的OpenClaw……
硬件版OpenClaw名字叫Distiller Alpha , 一款Linux硬件 , 核心計算模塊基于樹莓派CM5 , 8GB內存 , 64GB存儲 。
在此基礎上 , 還集成了墨水屏、麥克風、揚聲器、攝像頭……

特別小一個 , 手掌一半都不到 , 整體尺寸比手機還小 , 感覺能直接揣褲兜 。

所有都提前在這塊硬件里部署好了 , 掃下墨水屏上的二維碼 , 就能直接進入交互界面 , 和一個叫Pamir的Agent對話 。
OpenClaw能干的都能干 , 整理文件、翻閱X、發郵件……理論上 , 只要能通過「點擊」解決的事情 , 都沒問題 。
同樣是一個24小時待命的賈維斯 , 可以隨地大小Code 。

這些都不是重點 。
上面這些事情 , OpenClaw都能做 , 甚至能更夸張 。
Pamir最不一樣的地方 , 是它竟然還可以給硬件Vibe coding……
有人給掃地機器人裝了根機械臂 , 現在不僅能掃灰塵了 , 遇到大點的垃圾也能順手撿起 。

視頻鏈接:https://mp.weixin.qq.com/s/GqKxBt_FjuyKacsc_ckYiw
有個老哥在家里搭了一套賽車模擬器 , 把Pamir當「副駕駛」用 。
每次他跑完一圈后 , 這個「副駕駛」會自動幫他回顧和分析駕駛數據 , 然后把這些數據實時展示在他接上的一堆小顯示屏上 。

視頻鏈接:https://mp.weixin.qq.com/s/GqKxBt_FjuyKacsc_ckYiw
就連這個8×8的LED燈陣都能玩出花來 , 只需要一句話就能搞出各種炫酷的特效 。

視頻鏈接:https://mp.weixin.qq.com/s/GqKxBt_FjuyKacsc_ckYiw
如果你想 , 甚至能在這上面玩貪吃蛇……

視頻鏈接:https://mp.weixin.qq.com/s/GqKxBt_FjuyKacsc_ckYiw
各種離譜的demo見得多了 , 能給硬件Vibe coding的Agent倒還是第一次見 。
正好最近本地Agent火 , 相信大家心里多少都有不少困惑:
這條路到底和其他Agent有什么不同? 類似的創業者如何看OpenClaw? 用戶又該如何更好地打造自己的「賈維斯」?帶著這些問號 , 量子位找到了這家硬件版OpenClaw , Pamir的兩位創始人之一——葉天奇 , 聊了聊他們在本地Agent這條賽道上的想法 。
采訪原文超1.2萬字 , 信息密度很高 , 其中有不少有趣的觀點 。
為了完整呈現葉天奇的思考 , 我們決定不做過多處理 , 直接把全文端上來 。
在這場對話里 , 你會看到:
軟硬一體的Agent , 會有什么不一樣? OpenClaw到底做對了什么 , 火了之后為什么又迅速暴露出一堆安全問題? 為什么Mac mini并不是最適合部署Agent的硬件? 那些提前半年就體驗過OpenClaw這種能力的人 , 現在都怎么用本地Agent? 為什么對初創公司來說 , 硬件是一條更合適的路徑? AI時代下 , 電腦的最終形態可能會長什么樣?以下附上訪談全文 , 為提升可讀性 , 量子位在不改變原意的前提下 , 對內容進行了適當調整和刪減 。
請享用 。
OpenClaw、本地Agent , 以及電腦的下一步 Pamir是什么?Q:Pamir現在做的Distiller Alpha是什么?它能干些什么?
葉天奇:Distiller Alpha本質上是一臺Linux的mini PC , 一臺非常小的Linux小電腦 。
我們把傳統電腦里一些最基礎的元件單獨拎出來 , 配上小屏幕、LED燈、麥克風、揚聲器 , 以及各種各樣的IO接口 , 把它做成了一個非常緊湊的形態 , 整體尺寸比手機還小 。
在系統層面 , 我們給這臺設備預裝了Agent , 目前主要用于跑Claude Code 。 基本上 , 只要是Linux+Docker能做的事情 , 它都能做 。
最典型的場景是Vibe coding 。 現在有一批開發者非常癡迷Vibe coding , 希望隨時隨地都能寫代碼 , 他們會通過手機遠程操作我們的設備 。
除此之外 , 還有一批用戶會把我們的設備接到各種各樣的硬件上 , 通過Vibe coding的方式來開發和控制這些硬件 。
Q:「Vibe coding+硬件」的組合聽起來挺新鮮的 , 可以展開講講嗎?
葉天奇:這個方向其實并不是我們一開始有意設計的 。 從用戶角度來看 , 會購買我們設備的人 , 往往本身就很喜歡玩硬件 。
很多設計師 , 他們很懂電子產品設計 , 但并不擅長編程 。 過去他們使用的往往是比較簡單的開發板 , 如果要做原型 , 就需要雇電子工程師幫忙 。
現在他們會直接把Distiller Alpha接到硬件上 , 把自己的想法描述出來 , 系統就可以自動幫他把對應的邏輯和代碼生成出來 。
還有一些用戶 , 會用它去「接管」已經存在的設備 , 比如藍牙設備 。
很多藍牙設備其實并不需要額外的密碼 , 只要發送一串正確的二進制指令 , 就能完成控制 。
他可以直接對系統說:「幫我掃描一下附近有哪些藍牙設備」「幫我把這盞燈關掉」 。
很多智能家居都是自己獨立的一套App , 非常零散 。 用Distiller Alpha就能一個頁面里 , 控制家里所有的智能設備 。
再比如打印機 , 你不需要安裝官方App , 只要知道它內部使用的是什么芯片 , 就可以讓Agent寫代碼、做簡單的逆向工程 , 讓這臺打印機工作起來 。
Q:如果不靠Distiller Alpha , 極客通常是怎么完成這些操作的?
葉天奇:這個問題其實挺有意思的 。
我之前也問過一些用戶 , 發現主要取決于技術水平 。
技術能力強的人一直都是手寫 。 他們會先去讀硬件的說明書 , 搞清楚芯片型號、通信方式和編程方法 , 然后直接寫代碼、燒錄 。
但對技術能力沒有那么強的人來說 , 過去的主流方式 , 其實是用ChatGPT 。 他們會把需求丟給ChatGPT , 讓它生成一段代碼 , 然后復制粘貼到硬件的編輯器或燒錄工具里 , 點一下燒錄 , 再測試 。
如果發現不work , 就把報錯信息再反饋給ChatGPT , 讓它改一版代碼 , 再復制粘貼、再燒錄 。
有了我們的硬件之后 , 整個鏈路被閉環了 。 Agent可以自己寫代碼、自己燒錄到硬件上、自己讀取報錯信息、再根據結果修改代碼并重新燒錄 。 不再需要在中間反復做人肉中轉 。
Q:為什么Distiller Alpha會出現這么多偏硬件的玩法?
葉天奇:核心的原因在于出發點不一樣 。
OpenClaw是從軟件方向起步 。 即使你買了一臺Mac mini , 也很少想到把它當成嵌入式設備 , 塞進另一個硬件里 。
一方面體積擺在那里 , 另一方面它的IO接口數量有限 , 也不太容易激發用戶在硬件層面進行二次開發的欲望 。
而且OpenClaw本身更偏向于為知識工作者設計交互 。 對開發者來說 , 如果要寫軟件 , 不太可能通過WhatsApp、Telegram這種聊天氣泡式的方式 , 那會非常痛苦 。
本質上還是面向的人群不同 。 我們早期的定位就是remote——一個讓你隨時隨地都能接觸到自己Claude Code的設備 。 最早購買我們的 , 基本都是Early adopter型的開發者 。
后來隨著Vibe coding這個概念被更多人接受 , 有開始有越來越多非開發者、甚至傳統意義上的知識工作者購買我們的設備 。
有的用戶在自己買了之后 , 還會再給父母買一臺 。 而這些非開發者用戶 , 往往會把我們的產品當成一種「智能硬盤」來用 。
Q:Distiller Alpha本身的硬件由哪些組件構成?
葉天奇:我們在設計這款產品時的一個原則是:在體積允許的情況下 , 把能裝的能力盡量都裝上 。
比如燈帶 , 它的核心作用是顯示Agent的工作狀態 。 比如Agent在思考時 , 會顯示黃色燈光;當Agent需要用戶介入時 , 會閃爍綠色燈光 。 我們希望通過這種比較克制的方式 , 把Agent的狀態融入到設備本身 。
現在很多程序會用消息通知或者聲音提醒 , 但我們覺得 , 用一種更偏「環境感」的方式 , 通過視覺氛圍來反映Agent狀態 , 會更自然一些 。
而且 , 通過環境光來傳遞狀態的信息方式 , 本身就很極客 。 這點可以類比喜歡裝機、玩電腦的人 , 會很熱衷RGB燈效 。
屏幕的設計思路同樣比較極客 。 我們用的是一塊墨水屏 。 一方面 , 墨水屏顯示效果很好 , 很多開發者本身就對這種屏幕有偏好;另一方面 , 它的功耗非常低 。
有些用戶會把這塊屏幕改造成自己的Personal dashboard , 比如顯示股票信息、未讀郵件數量 , 或者當天還有多少任務需要處理 。 這類信息不需要頻繁刷新 , 墨水屏非常合適 。
還內置了麥克風和揚聲器 。 有的用戶會設定:每天早上醒來時 , 讓設備從自己的音樂列表里挑一首最喜歡的歌來叫醒自己 。
另外 , 我們還內置了一個攝像頭 , 主要是給開發者使用 。 有人會用它來遠程看看家里的貓狗 , 或者用來監控另一臺電腦的屏幕狀態 。 這些都屬于比較自由的開發用途 。
Q:算力配置是什么水平?
葉天奇:目前是8GB內存、64GB存儲的CPU平臺 。
這個配置其實不是一開始就想清楚的 , 你需要積累很多真實使用的know-how , 才能知道跑一個Agent到底需要多大的內存、多少存儲 。
我們會從幾個維度去看 , 比如:一個普通用戶通常會同時跑多少個Agent;這些Agent的知識資產大概會增長到什么規模;一個用戶大概用多久 , 設備里的存儲就會被填滿;Agent的運行上限在哪里 , 瓶頸會出現在內存、存儲還是IO上 。
一個很有意思的發現是 , 我們一開始低估了知識資產的增長速度 。
之前沒想到會有這么多知識工作者 , 有些用戶會長期給設備外接一塊SSD , 把每一次對話、每一次任務執行的記錄全部存下來 , 在他們看來 , 這些是非常重要的個人資產 。
這類需求很難在產品設計階段預判 。 但一旦接觸到用戶 , 就會意識到存儲本身 , 是Agent產品里一個非常關鍵的維度 。
Q:Pamir的技術原理是怎樣的?
葉天奇:我們在產品路徑上 , 和很多AI公司不太一樣 。 我們是先做硬件和系統 , 再在探索過程中不斷摸索軟件形態 。
一開始 , 我們在設備里直接內置了VSCode 。 我們的判斷是 , VSCode基本可以覆蓋大多數軟件開發和交互需求 。 后來隨著產品迭代 , 我們不斷做減法 , 把界面逐漸收斂 , 最終拆掉了傳統意義上的「GPT對話界面」 。
軟件交互主要基于內網直連 。 只要這臺設備是開機狀態 , 無論你在什么地方 , 用電腦也好、手機也好 , 都可以直接訪問到它 。 有點像一個ChatGPT式的入口 , 不同終端之間是完全同步的 。
硬件交互方面 , 設備上有一個小的顯示模塊 , 會實時顯示當前設備的連接狀態 。 比如我們會展示一個二維碼 , 任何人用手機一掃 , 就可以直接進入這臺設備 , 向Agent發送指令 。
Pamir的差異點在哪?Q:Distiller Alpha和OpenClaw有什么區別?
葉天奇:在我看來 , OpenClaw更像是一個「軟件傻瓜包」 。
它本質上像一層膠水 , 把很多已有的能力粘合在一起 , 解決的是可用性和易用性 。 這有點像當年大家對原生安卓系統不滿意 , 于是會去刷各種第三方ROM , 比如MIUI 。
OpenClaw刻意簡化了很多復雜的項目管理流程 , 把所有交互都集中在一個Chat session , 同時在記憶持久化上做了大量工作 , 讓普通用戶更容易使用Agent 。
其實類似OpenClaw的項目以前也不少 , 沒有十個也有五個 , 只是今年OpenClaw跑出來了 。 我認為一個重要原因在于 , 它「膠水粘得足夠多、足夠好」 。
我們更關注另一層問題:如何讓用戶快速、安全地訪問Agent?當Agent出錯時 , 如何在系統層面進行回滾?
圍繞這些問題 , 我們把自己正在做的事情統稱為Agent runtime 。
除此之外 , 我們還把麥克風、揚聲器、燈帶等硬件能力全部打包成SDK , 再進一步抽象成Skills , 原生地放進Agent體系里 。
這樣一來 , Agent在運行時 , 就不只是「生成文本」 , 而是可以通過硬件去表達狀態、反饋和意圖 。
Q:把硬件能力打包成Skills , 解決了什么痛點?
葉天奇:一個很直接的痛點是 , 非技術用戶如何快速上手硬件 。
我們在賣產品時 , 會附贈一個硬件小玩具 。 哪怕你完全不懂技術、不懂編程 , 拿到產品之后也可以立刻開始玩 。 只需要開機 , 把這個硬件插上 , 就可以直接用 , 不需要理解它的工作原理 。
這個過程其實不需要我們在Agent層或者模型層投入特別大的精力 。
因為硬件是通過USB和設備通信的 , 只要插上 , Agent就能立刻識別你連接了什么設備 。 比如你插的是一塊基于ESP32的LED模塊 , 這個信息會直接在系統里被識別出來 。
當你再去和Agent交互時 , Agent會先檢查當前的USB端口上連接了什么設備 。 它會發現這是一個基于ESP32的、具體型號是什么的硬件 , 然后再去查看:當前項目目錄里 , 是否已經存在這個硬件對應的說明書 。
然后Agent就會知道 , 如果要給這個硬件寫程序 , 需要用什么工具、通過什么方式刷進去;如果過程中遇到問題 , 它也知道該如何提示用戶 , 比如提醒你去按一下設備上的reset按鈕進行排錯 。
Q:Pamir能做OpenClaw能做的事情嗎?
葉天奇:可以的 。 因為Distiller Alpha本身也是一臺完整的電腦 , 和買一臺Mac mini來跑是同一種性質 。
只要是那種長期、可重復利用知識資產的工作 , 都可以直接放在我們的設備上去運行 。
有一位用戶是網絡安全專家 , 他積累了非常多年的安全經驗 , 自己整理了一大批網絡安全相關的資料和方法論 , 全都記錄在文檔里 。 他把這些文檔交給Agent , 相當于把自己的經驗沉淀成一套可以執行的SOP 。
在網絡安全領域 , 有一種常見的工作方式叫做漏洞賞金 , 安全研究者會到各個網站上尋找漏洞 , 找到之后網站會支付報酬表示感謝 。
這個用戶就是把自己的經驗交給Agent , 讓Agent 24小時不間斷地在各類網站上尋找漏洞 。
Q:Pamir的自研硬件 , 和Mac mini這種通用電腦有什么區別?
葉天奇:Mac mini有點太奢侈了 , 如果你的需求只是檢查一下Gmail、看看Slack消息 , 那其實沒必要花這么多錢買一臺Mac mini 。
更重要的是 , Mac mini并不是一個原生為Agent設計的系統 。
今天不管是電腦廠商還是手機廠商 , 本質上做的還是「給人用的設備」 。 他們并沒有在系統層面 , 專門為Agent預留一套執行、行動、回滾的機制 。
所以Mac mini開箱之后 , 你需要自己做大量setup , 這也是為什么像OpenClaw這類方案 , 在真實生產環境中會遇到很多問題 。
當然 , 從純性能角度來說 , Mac mini的硬件上限很高 。 但我認為 , 決定一個系統是否能真正投入生產的 , 不是性能上限 , 而是系統層面的下限和魯棒性 。
Mac mini加OpenClaw的方案是沒法真正投入生產的 , 原因就在于它的不可控性太強 , 它不是原生的Agent系統 。
Q:那Pamir為了做一個「原生Agent硬件」 , 相比Mac mini砍掉了哪些功能?
葉天奇:首先 , 我們沒有桌面 , 也沒有傳統意義上的屏幕系統 。
如果你從第一性原理去思考 , Agent的工作時長會越來越長 , 能力也會越來越強 , 最終它更像是你的一個同事 。 而你不會和同事共用一臺電腦 。
這也是為什么我們沒有給Distiller Alpha做桌面系統和屏幕 。 Agent當然可以在內部使用虛擬桌面、虛擬瀏覽器 , 但這些并不需要被人看到 。
Q:圍繞這種第一性思考 , 你們增加了什么原生能力?
葉天奇:我們非常重視安全性 。
一個很重要的能力是自修復 。 如果你把一個OpenClaw交給非技術用戶 , 玩一天之后 , 很有可能就把系統搞壞了 , 因為Agent本身是可以修改自己代碼的 。
進Windows時 , 你可以按F12進入恢復模式 , 我們認為原生的Agent電腦也應該有這樣的機制 , 不過是由Agent自己來完成 。
我們的設備里有一個watchdog系統 。 當系統出現問題時 , 它會先進行自檢 , 然后告訴你:比如某個關鍵文件被誤刪 , 導致系統異常 。 你只需要確認一次 , 系統就會在幾分鐘內完成自修復 , 重啟后回到正常狀態 。
在這種情況下 , 我們甚至不需要提供什么售后支持 。 如果你的電腦壞了 , 讓它自己修自己就好 。
另外 , 硬件本身也是一個物理層面的沙盒 。
有些安全問題 , 在軟件層面很難徹底解決 , 但通過硬件就輕松很多 。 比如你在使用Mac時 , 會用到指紋解鎖 。
還有一個很重要的點 , 我們的每臺設備都有一個獨一無二的ID 。 在硬件層面 , 我們可以加入專門的加密芯片 , 用來存儲這個Agent的ID 。 這個ID只能通過物理層面的方式進行暴力破解才能拿到 。
Agent所綁定的高敏感個人信息 , 是可以直接和硬件捆綁在一起的 , 這對于防范圍繞Agent的攻擊非常重要 。
Q:OpenClaw社區最近反饋了很多安全問題 , 比如擅自重構文件夾 , 甚至有用戶的錢全被轉走了 , 這是怎么回事?
葉天奇:這和OpenClaw的設計取向有關 。
它為了追求便捷性和自動化 , 希望創造更多「hands off」的驚喜時刻 , 因此在系統里加入了非常多的自動執行邏輯 。 比如它內部有類似「心跳機制」的設計 , 每隔一段時間就會主動去尋找可以做的事情 。
但它的下限和系統魯棒性不足 , 這種過強的主動性和自動性 , 會直接帶來不穩定性 。
在我看來 , OpenClaw更像是一種新的軟件范式 。 如果你去看它生成的代碼 , 會發現整體結構非?;靵y , 有不少bug 。
這種產品會越來越多 , 而且也會繼續有人使用 。 但它和我們這種有專業團隊、一步一步從系統層和硬件層進行設計、開發的產品 , 在本質上還是不同的 。
我們不會像OpenClaw那樣 , 為了讓Agent能一直跑 , 就不斷給它疊加各種Skills 。 在權限和安全設計上 , 我們更強調引入人的監管 。
Q:所以還是OpenClaw的上限更高?
葉天奇:我糾正一個容易被誤解的點 , 并不是說OpenClaw本身的軟件或架構決定了它的上限更高 。
更多是因為外部條件:它跑在Mac mini這種性能很強的硬件上 , 同時又調用了當前最好的模型 。
Q:有人把OpenClaw能做的事情從簡單、中等到高難度分了幾個級別 , 你能給Pamir做個類似的分級嗎?
葉天奇:很多知識工作者買我們的設備 , 做的事情其實非常簡單 。 他們把它當成一個「聰明的硬盤」 。
比如有一位律師用戶 , 有一個項目涉及兩百多份文件 。 我一開始也很疑惑他為什么要買我們的設備 , 后來發現他之前一直用ChatGPT , 但沒辦法一次性把這么多文件交給它 。
我們的設備剛好解決了這個問題 。 對他來說 , 它就是一塊可以被Agent理解、可以直接操作的移動硬盤 。
再比如 , 有些用戶會把U盤插到設備上 , 然后直接對Agent說:「這個U盤里有個文件 , 你幫我改一下 。 」Agent可以自己進入U盤目錄 , 找到文件、修改、再告訴用戶已經完成 。
這一層的本質就是文件系統級能力 。
再往上一層 , 就涉及真實的「電腦行為」 。
比如讓設備去查看Twitter、訂餐廳、處理網頁上的事務 。 這類事情如果放在純云端環境 , 其實并不好做 。 但我們的設備本身就是一臺真實的電腦 , 有自己的瀏覽器、桌面和網絡環境 。
舉個例子 , 我之前想訂一家餐廳 , 一直訂不到位置 。 我就讓設備去盯著網頁 。 銀行卡信息是存在設備里的 , 一旦有空位出現 , 它就可以立刻幫我完成預訂 。
過去類似的事情 , 大家通常是寫腳本來做 , 但很容易被網站的「機器人檢測」攔下來 。 現在你可以讓Agent像人一樣打開網頁、瀏覽、點擊 , 這種行為很難被識別為自動化 。
再往上一層 , 往往和你個人的技術能力或知識資產高度相關 。
比如有程序員用戶 , 白天在公司上班 , 家里放著我們的設備 , 把自己的「第二份工作」相關內容全部交給Agent 。 他會在中午休息或者空閑時間 , 通過設備檢查第二份工作的進度、下達接下來的任務 , 相當于同時做兩份工 。
類似的情況也出現在電氣工程師、維修技工身上 。 他們過去要帶著電腦去現場檢修設備 , 現在只需要帶這臺設備 , 把可復用的維修流程和知識資產都交給Agent , 再連接服務器就行 , 能顯著加快檢修效率 。
再往上走 , 就是偏極客的高級玩法了 。
比如之前說的逆向打印機、強行控制硬件 。 如果你的技術背景足夠扎實 , 只需要把這些知識交給Agent , 它就可以很快幫你寫出一份Linux驅動 , 直接控制設備 。
為什么要自研硬件?Q:Pamir是在用一臺硬件去替代原本的電腦 。 另一種是Manus路線 , 讓Agent操縱云端的虛擬計算機 。 如果看便攜性 , 這種方式豈不是連額外硬件都不用帶 , 只需要一部手機就可以了?
葉天奇:對 , 從技術上來說 , 這是另一種解法 。
我認為這兩種形態在未來都會長期存在 , 只是它們適合的任務類型不一樣 。
云端虛擬計算機更適合做一次性的任務 , 比如調研、科研相關工作 。 這類任務往往是one-shot的 , 不太強調長期運行和狀態持久化 。
但如果你需要的是長期持久化的Agent , 問題就來了 。 這些信息要不要一直放在云端?那是不是意味著你要持續付費?而且很多高度個人化的信息 , 大家也不太愿意長期放在云上 。
這其實和人們買電腦是一樣的邏輯 。 理論上 , 很多文件都可以放在云端 , 但真正和你每天工作強相關、需要隨時訪問的東西 , 你還是會更希望它在自己身邊、隨手可用 。
另外一個差別點是 , 硬件更容易通過USB和硬件打交道 。 尤其是知識工作者 , 會大量使用U盤、SD卡 , 實體設備在這種場景下更順手 。
Q:除了剛剛提到的這些功能性價值之外 , 從你的個人體驗來看 , 這種實體硬件在情緒價值上 , 能帶來什么?
葉天奇:情緒價值其實非常多 。
在早期階段 , 如果你想用純軟件去「驚艷」開發者 , 其實是很難的一件事 。 通過硬件形態 , 反而更容易讓他們產生情感連接 。
比如Distiller Alpha , 外殼表面覆了一層特殊的手感漆 , 整體是偏柔軟的觸感 。 很多用戶第一次拿到設備時 , 都會覺得這是一個遠遠超出預期的體驗 , 因為他們從沒見過一臺「軟的」的電腦 。
這會讓他們意識到:這不是一個Mac mini的替代品 , 而是一個全新的品類 。
產品形態如果不夠創新 , 用戶第一句話一定會問:「這和手機有什么區別?」「這和電腦有什么區別?」
我覺得在做面向未來的產品時 , 很重要的是 , 要主動打破用戶已有的認知框架 , 消解他們的疑慮 , 讓他們來不及問出這些問題 。
此外 , 當你通過硬件設計、材質、觸感 , 讓用戶意識到這是一個從未見過的形態時 , 產品的情緒價值就會被顯著放大 , 這對To C產品來說非常重要 。
Q:這也是為什么你們一開始會選擇線下銷售的原因嗎?
葉天奇:對 。 我們會去參加各種黑客松、線下活動 。
你問的很多問題在線下也經常被問到 , 比如:為什么不直接跑在云上?為什么不直接用ChatGPT?
但現在問這些問題的人越來越少了 。 我覺得這和OpenClaw的走紅也有關系 , 如果OpenClaw是四個月前發布 , 很多人可能根本不知道它是什么 。 但現在 , 市場對Agent、以及「Agent需要自己一臺電腦」這個概念的接受度提高得很快 。
Q:你們在黑客松遇到消費者 , 會怎么說服他購買?
葉天奇:我一般會先問一個很簡單的問題:「你平時用不用Claude Code?」
如果對方說用 , 那其實已經基本落在我們的目標用戶范圍里了 。
接下來我會繼續問他:「你現在有沒有在寫代碼?」
通常他說沒有 。 我就會接著說:
「你其實應該在寫代碼 , 現在寫不了 , 是因為你把你的電腦合上了 。 」
這時候他往往會愣一下 , 然后覺得你說得有點道理 。
然后我會直接掏出手機 , 給他看我正在用手機遠程Vibe coding 。
這一刻通常就已經完成了認知轉變 。
還有一些不是當場發生的 。 有一個極客 , 平時用機械鍵盤 , 晚上敲代碼聲音很大 , 女朋友嫌他太吵 , 不讓他繼續敲 。
但那天晚上他的靈感還沒斷 。 他回到床上 , 突然想起了我們的設備 , 于是直接給設備發消息 , 繼續推進他的項目 。
那一刻他覺得特別爽 。 后來他在社交平臺上發了很多帖子 , 主動推薦大家買我們的產品 。
我覺得本質上 , 我們打動的 , 是那些不希望被打斷心流的人 。
Q:那假設我已經被說服了 , 也花了250美元買了這個設備 , 我拿到設備后要做些什么?
葉天奇:首先你需要有一個Claude賬號 。 大部分購買我們設備的人其實已經有了 。
拿到設備之后 , 你只需要插上電 , 它會先顯示一個二維碼 。 掃這個二維碼之后 , 會進入Wi-Fi連接頁面 , 設備連上網之后 , 會再生成一個新二維碼 。
你再掃一次這個二維碼 , 就可以進入設備頁面 , 登錄你的Claude賬號 , 然后就可以開始對話了 。
在最開始的階段 , 我們會給用戶準備一些「玩具級」示例 。
比如我們會引導你創建一個個人主頁 , 這個主頁直接跑在這臺小電腦上 。 它可以每天幫你抓取你感興趣的論文、新聞或信息更新 。
硬件這塊 , 我們會附贈一個硬幣大小的8×8的LED燈陣 。 拿到這個小玩具后 , 有些顧客會描述自己喜歡的游戲角色 , 說:「你幫我把這個角色展示出來 。 」
然后設備會自己去網上查這個角色的形象 , 下載需要的依賴 , 生成對應的程序 。
兩分鐘左右 , 這個LED燈陣上就會開始播放他喜歡的角色動畫 。 整個過程用戶什么都不用做 。
Q:在部署成本這件事上 , Pamir的優勢主要體現在哪里?
葉天奇:我們其實準備了兩套使用方式 。
對技術人員來說 , 你可以直接在電腦上打開 , 用的就是VSCode這一套熟悉的IDE體系 。 這一類用戶幾乎是零門檻 , 他們本來就在用這些工具 。
對非技術人員來說 , 他們完全不需要碰電腦 , 可以直接用手機 。 手機端是一個和ChatGPT很像的網頁界面 , 通過對話的方式來使用 。
當然 , 非技術用戶也不是完全不需要學習 , 只是學習成本會低很多 。 我也承認 , OpenClaw在這一點上做得很好 , 它通過集成到用戶已經熟悉的聊天工具里 , 對非技術用戶來說 , 幾乎是「天然可用」的 。
所以兩者最大的差別 , 其實是在交互路徑上 。
Q:剛才聊了很多新用戶的體驗 , 但你應該算最老的用戶 , 用了這么久本地Agent , 它對你個人的生活和工作習慣 , 帶來了哪些變化?
葉天奇:變化其實非常大 。
我們是深度用戶 , 現在大家對OpenClaw的體驗 , 我們在半年前就已經經歷過了 。
到現在 , 我們公司內部已經開始出現一種現象——
傳統電腦的存在感越來越低 , 很多工作 , 用設備+手機+iPad , 甚至再加一個AR眼鏡 , 就已經足夠了 。
現在我們在打開電腦之前 , 都會先問自己一個問題:我現在要做的這件事 , 能不能交給設備?
如果答案是肯定的 , 那這件事可能已經不需要人去做了 。
所有人的角色 , 幾乎都被迫「往上提了一級」 。 以前你可能還是一個主要負責寫代碼的角色;現在你更像是一個架構師 , 需要決定方向、拆解問題、設計系統 。
Q:當Pamir幫把很多工作自動化后 , 你把時間花在了什么地方?
葉天奇:學習 , 讀書 。 當然 , 作為CEO , 我更多的時間會放在判斷接下來幾個月可能發生什么 , 以及應該圍繞這些變化去設計怎樣的軟件架構 。
真正花時間的地方 , 已經從「執行」 , 轉移到了Review和思考上 。
過去 , 行動比想法更有價值 。 公司之間的差距 , 主要來自工程能力和工程時間的堆積 。
但現在 , 行動本身的價值在下降 , 因為Agent可能十分鐘就把事情做完了 。 反而是你的思考、你的判斷、你的愿景 , 變得越來越重要 。 所以我們現在會花大量時間去復盤、討論、對齊方向 。
Q:這種轉變 , 會對公司的組織形式和工作范式帶來什么影響?
葉天奇:我覺得這種變化帶來的沖擊會非常大 , 很多公司可能還沒真正意識到這一點 。
如果把今天的大廠 , 尤其是一些Frontier Lab , 和普通創業公司放在一起看 , 會發現差距非常明顯 。
原因在于 , 模型廠商掌握著模型本身的控制權 。
用戶在使用過程中遇到的所有問題 , 都可以被他們捕捉到 。 這些問題會直接進入下一輪后訓練 , 模型的下限會不斷被抬高 , 魯棒性會越來越強 。
這意味著他們是可以形成閉環的 , 模型和Agent可以一起成長 , 產品會越用越好 , 內部效率也會越來越高 。 這也是為什么Claude產品會越用越好 。
相比之下 , 如果你只做Agent layer , 就算你把Agent寫得再好 , 它也沒法把反饋「喂」回模型 。 你只能不斷用人力去維護規則、修補邊界 。
我覺得今天的創業要想清楚一件事:自己的真正優勢和差異化到底在哪里?
一定要做那些別人暫時做不了的事情 , 主動避開不公平競爭 。
Q:如果Claude下場做類似的事情 , 你們的護城河在哪?
葉天奇:對我們來說 , 就是系統層和硬件層 。
硬件意味著供應鏈、生產、真實用戶交互、物理世界里的反饋 , 這些并不在模型到Agent的閉環之中;系統層的沙盒、安全、回滾機制 , 同樣是在模型和Agent之上的一層 。
說實話 , 今天軟件層面的護城河已經非常薄了 , 而且只會越來越薄 。 就算你做出來一個新功能 , 別人可能花兩天就能把復現出來 。
真正的護城河 , 更多集中在硬件本身 , 以及軟硬件的深度集成上 。
能耗、芯片選型、內存和存儲的配比、Agent能跑到什么邊界、供應鏈周期 , 這些都需要大量經驗和時間去一點一點堆出來 。
核心還是兩點 。
第一 , 是你對Agent的認知深度 。
這個領域變化太快了 , 幾乎每天醒來都會出現新的東西 。 如果你對Agent的理解沒有至少幾個月的前瞻優勢 , 很容易就會陷入被動追趕 。
第二 , 是你能不能做出10倍、20倍級別的用戶體驗差異 。
如果只是1.2倍、1.5倍的改進 , 在今天的軟件競爭環境里 , 很快就會被淹沒 。
你看現在Claude產品確實已經很好用了 , 但真正的非技術用戶有多少人在用Claude Code?
在我看來 , 這個體驗距離「我爸媽也能用」之間 , 依然存在明顯的gap 。 而這個gap , 恰恰是本地Agent和軟硬件結合還有機會去填補的地方 。
Q:有沒有一些關于使用Agent的小tips , 能讓普通用戶用得更高效一些?
葉天奇:我覺得可以先假設一個前提 。 如果大家用的都是頂尖模型、頂尖Agent layer , 那么最終效果的差異 , 很大程度上并不來自「模型聰不聰明」 , 而是你如何和它溝通 。
一個很常見的問題是 , 很多人一上來就把一個很大的任務一次性交給Agent 。 這種情況下 , Agent做不好是非常常見的 。
我自己的習慣是先和Agent一起做計劃 。 但我也不會讓它一次性把所有事情規劃完 , 然后直接Kick off全流程 。 那樣在執行過程中 , 幾乎一定會出錯 。
我傾向于把任務切割成足夠小、足夠清晰的步驟 , 再告訴Agent把這套計劃存下來 。
這樣一來 , 它在后續執行時 , 可以不斷回訪「自己該做什么」 , 整個過程會更有條理 , 執行的魯棒性也會更高 。
還有一個很多人容易忽略的點:如何把一次對話 , 轉化成可復用的知識資產 。
很多人Vibe coding完了就結束了 , 這個過程中產生的大量經驗 , 并沒有被保存下來 。
比如你在調一個藍牙模塊 , 怎么都連不上 , 最后發現是因為某種芯片只接受特定格式的消息 。 這本身就是一個非常有價值的知識點 , 在之后的項目里 , 很可能會反復用到 。
所以我會建議用戶 , 在使用過程中有意識地引導Agent把這些錯誤、踩坑、解決路徑 , 總結成可復用的Skills或規則 。
不要用完就結束 , 記得持續積累屬于你自己的知識資產 。
本地Agent的創業感悟Q:能跟我們講講你的創業故事嗎?最開始做這個項目的時候 , 起心動念是怎樣的?
葉天奇:說實話 , 這個項目里 , 運氣的成分挺大的 。
我們一年半以前就開始做Pamir 。 那個時候 , 很多人連Agent是什么都不知道 。 當時Pamir也不是現在這個形態 , 我們最開始做的是端側AI , To B業務 。
我和聯創張城銘畢業后 , 大概在大廠工作了兩年 。 那段時間 , 我們白天上班 , 晚上和周末就嘗試各種各樣的項目 , 但一直沒有真正做出什么特別大的東西 。 Pamir對我們來說 , 算是一次孤注一擲 。
在這之前 , 我們一直都是邊上班、邊做項目 。 但做Pamir的時候 , 我直接搬到聯創家里 , 睡在他家的沙發上 。 那段時間其實挺糟的 , 全職工作也做不好 , 項目也做不出來 。 想著「要么成、要么就算了」 。
當時做Pamir的判斷是:如果你要做嵌入式系統 , 就一定需要一個端側的硬件板子 。 所以一開始我們是在賣開發板 , 面向的是硅谷一小撮在做對話式AI和硬件結合的極客 。
不過 , 聯創和我都是技術出身 , 對融資一無所知 , 也不知道應該怎么講故事 , 基本就是硬著頭皮做 。
花了幾周時間把原型做出來之后 , 就直接拿到硅谷去賣 。
Q:最開始賣給硅谷 , 順利嗎?
葉天奇:比我想象中要順利 。
當時正好有兩個非常有名的AI硬件項目 , 一個是Rabbit , 另一個是Humane , 帶起了一波AI硬件創業的熱潮 。 那個時間點 , 市場是被充分教育過的 , 我們本身的產品也很有優勢 。
當時很多做語音交互的AI公司都非?!副恐亍梗河脴漭?, 加USB麥克風 , 再加USB揚聲器 , 拼成一個很大的盒子 。
我們給他們展示的 , 是一個非常小的板子 , 卻能完成他們現有方案里大部分的功能 。 這對他們來說吸引力非常大 。
Q:當時和你們在同一批起跑的競爭對手 , 現在都是什么狀態?
葉天奇:很多都選擇All-in端側模型 , 甚至是Double down在端側這條路上 , 但基本都轉去做To B業務了 。
從市場上看 , To B這幾年是有增長的 。 端側模型越做越小、越做越輕 , 在一些明確的落地場景里是成立的 , 比如車機系統、企業內部的私有化部署 , 都會有需求 。 只不過 , 這條線的增長速度 , 明顯趕不上Agent相關的公司 。
我們也不太適合做To B生意 , 坦白說 , 我們不太喜歡和B端客戶打交道 。
一是交期要求非常嚴格 , 二是很難發揮想象力 。
好不容易從大公司出來創業 , 結果折騰一趟后 , 發現自己又在給別人打工 。
有一次我在給產品寫代碼 , 讓Agent跑任務 。 我盯著屏幕看了大概兩分鐘 , 什么都沒做 , 只是在發呆 。
突然一個念頭閃過——為什么我的Agent在工作 , 而我卻要盯著它看?
從這個體驗出發 , 我們推導出一個結論:未來一定需要一種Agent自己的、獨立的計算設備 。
想清楚這一點之后 , 我們幾乎是立刻決定把所有端側相關的方案全部刪掉 , 全面接入當時最新的大模型 , 徹底轉向To C 。
之后的事情就比較順了 。
我們開始正式賣產品 , 開始大量做線下展示 。 后來Vibe coding開始流行 , 然后Claude Code火起來 , 我們又繼續往這個方向演進 。
Q:你覺得現在更幸福 , 還是之前在公司上班的時候更幸福?
葉天奇:這是個好問題 。
其實我之前也被朋友問過類似的問題 , 問我理想的生活狀態是什么樣的 。 我想了很久 , 發現現在的生活基本就是我理想中的狀態 。 每天都有新的挑戰 , 還能和志同道合的人一起解決問題 。
你可能聽說過「傳教士」和「雇傭兵」的說法 。 我們更像傳教士 , 是在為一件高于自我的事情工作 , 即使短期沒有物質回報也愿意堅持 。
一開始做Agent電腦 , 很多人根本理解不了 , 覺得不可理喻 。 但我們自己是信的 , 甚至覺得這件事情的意義 , 高于我們個人本身 。
我們現在創業在做的 , 就是把它帶到這個世界上 。 我很享受這個過程 。
Q:你有沒有更宏大的愿景?AI電腦這件事 , 最終會走向哪里?
葉天奇:我們希望替代現在意義上的電腦 , 更準確地說 , 是替代筆記本電腦 。
今天人的大量時間 , 還浪費在極低價值的操作上 , 比如在不同系統、不同表格之間手動搬運數據 。 我們希望把這些工作徹底自動化 , 讓人把精力用在真正需要思考、判斷和創造的事情上 。
也有一點很個人的動機 。 我其實非常想挑戰蘋果 。
我現在對蘋果的態度是復雜的 。 一方面我很依賴它的生態;另一方面 , 我對它當前定義「個人計算」的方式感到不滿意 。 公司里很多人也有類似的感受 。
手機廠商當然知道自動化、智能體是趨勢 , 他們也會往這個方向走 。 但路徑有根本差異 。
他們做的是前臺 , 所有能力最終都要回到屏幕、交互界面和注意力占用上;我們做的是后臺 , 很多任務不需要屏幕 , 也不需要人持續盯著 。
我們認為這是一次非常難得的機會 , 終于可以不再需要圍繞「屏幕」去設計產品 。
Q:最近OpenClaw把Mac mini又帶火了一波 , 你什么感受?
葉天奇:這確實是我們很難在短期內追平的一點 。
蘋果在處理器、硬件整合上的能力 , 幾乎沒有對手 。 這也是我們后面考慮逐步引入高通芯片、一點點縮短硬件差距的原因 。
但從另一個角度看 , 在Agent成為主導范式之后 , 硬件參數的重要性在相對下降 。 蘋果依然可以繼續做極其強大的通用計算設備 , 這件事不會消失 。 但它是否一定是Agent的入口 , 這件事并不確定 。
歷史上類似的情況其實反復出現過 。 早期個人計算時代 , 也有像IBM這樣的巨頭存在 , 但形態、入口和主導權依然發生過轉移 。
我覺得今天是又一次輪回 , 只是這一次的核心變量變成了Agent 。
— 完 —
量子位 QbitAI · 頭條號簽約
【兩個95后華人,搞出硬件版Clawdbot,售價1700元】關注我們 , 第一時間獲知前沿科技動態

    推薦閱讀