AI 創業訪談?丨心識宇宙陶芳波:用一百份筆記,復刻 AI 版的自己

AI 創業訪談?丨心識宇宙陶芳波:用一百份筆記,復刻 AI 版的自己

創造自己 , 分發自己 。




文丨孫海寧
編輯丨王姍姍




心識宇宙(Mindverse)創始人陶芳波有一套自己的 AI 助手分類法 , 分類標簽都是人稱代詞:


第一類 AI 助手主攻陪伴 , 對應人稱代詞 her , 就像電影《她》中承接主人公各種情緒的 “薩曼莎”;第二類助手負責執行具體任務 , 類似《鋼鐵俠》中的智能管家 “賈維斯” , 對應人稱代詞 him 。


心識宇宙正在做第三類 AI 助手:me 。 這家公司想幫用戶復制自己的 “第二自我” , 構建 “身份大模型”(AI Identily Model)——一個在現有基礎模型基礎上 , 根據用戶數據微調的大語言模型 。 它的認知、偏好、價值觀和用戶個人對齊 , 能代表用戶和其他應用接口、AI 交互 。


創業前 , 陶芳波一直從事 AI 研究 。 他在清華讀完軟件工程專業本科后 , 赴伊利諾伊大學香檳分校攻讀博士學位 , 專業方向是數據挖掘 , 即使用機器學習方法尋找復雜數據背后的結構 。


讀博期間 , 陶芳波曾利用 AI 技術幫反恐機構分析恐怖組織關系網;畢業后 , 他先在 Facebook 挖掘社交關系;然后到阿里達摩院的神經符號實驗室 , 用跨學科知識建模人腦 。 GPT-3 上線后 , 他辭職成立心識宇宙 。


為了讓模型更懂用戶 , 多數 AI 技術公司的做法是總結出用戶身份信息、個人偏好 , 然后把它們作為上下文輸入模型 。 陶芳波主張把用戶的記憶、情感、價值觀參數化 , 根據用戶數據微調模型 。 他認為如果各個用戶使用同樣的底層模型 , 哪怕上下文存在差別 , 人機對齊的效果也有限 。


微調模型是參考大腦運行原理:人腦不儲備細碎的知識 , 而是為人物、事件創建索引 , 由此牽連出相關人物、事件 , 心識宇宙用用戶數據訓練模型前 , 也會先歸納、串聯數據中的關鍵信息 。 人腦每天白天緩存經歷 , 夜晚消化記憶 , 心識宇宙也計劃每天訓練一次身份模型 。


相比多模態大模型、Agent, 陶芳波承認身份模型還不是一個已被行業內廣泛認可的方向 , 但在 AI 能讀能看也能聽、通過調用各種工具幫用戶完成任務的未來中 , 一個思維和用戶更同頻、能代替用戶主動發起任務和驗收執行結果的身份模型 , 也是不可或缺的 。


Me.bot 是心識宇宙面向海外用戶的 App , 它形態類似記事本 , 但能通過用戶日常記錄 , 逐步養成能理解、表達并代表用戶的 AI 身份模型 。 去年 5 月上線后 , 已獲得近百萬名用戶 。 今年三月下旬 , 心識宇宙團隊又發起開源項目 Second Me , 公開他們的身份模型訓練方法 。 三周內 , 已經有超過一萬人在 GitHub 為 Second Me 項目打上星標 , 是今年 GitHub 平臺上關注度增速最快的開源項目之一 。


在陶芳波的終極想象里 , 人人擁有身份模型 , 意味著現實中運行的社會網絡可以被復制到線上 , 不過在線上交互的 AI 不受人類打字或講話速度限制 , 效率更高 。 身份模型替代人類收發任務、相互協作 , 人們將會從被迫使用各種工具的狀態中解放出來 。


以下是《晚點 LatePost》和陶芳波的對談 。




創業重定向 , 從他/她到 “我”




晚點:Mindverse 第一款產品 MindOS 是一個幫用戶搭 Agent 的平臺 , 類似 him/her 的集合體 。 之后團隊怎么想到要轉型做 me 的?


陶芳波:一是因為技術成熟度 。 MindOS 上線是在 2023 年 , Agent 技術并不成熟 , 直到今天 Agent 離實際幫用戶完成任務也有些距離 。 二是我們發現很難讓普通用戶給自己搭一個 AI Agent, 有這樣意愿的人很少 , 多數非 AI 工具對用戶來說已經足夠好用了 。


人和自己相處是最多的 。 Facebook 幫每個人構筑了數字身份 , 成為人類世界的基礎設施 , 用 AI 構建數字身份效果會比 Facebook 更好——它不止能承載留言、評論 , 還可以主動創建新連接 。


人也是自戀的 。 訓練一個第二自我 , 會有種自己變永恒的感覺 。 在 AI 時代 , 被超級智能吞噬不是一個假設 , 而是很多人實實在在的擔心 。


晚點:所以你們做了兩個 AI 分身產品——Me.bot 封裝在產品內 , 開箱即用;Second Me 作為 GitHub 項目 , 是一個開源產品?


陶芳波:對 , 但我認為我們做的不是分身(avatar)而是身份(identity) 。 人可以有很多分身 , 但只會有一個身份 。 分身往往帶著場景屬性——一個分身去約會、另一個去購物;但身份和場景無關 , 是基礎設施 , 有各種使用可能 , 怎么用由用戶決定 。


具體場景內 , 一個分身承載的信息是身份的子集 。 就像一個人在工作、生活場景下往往呈現兩個狀態 。 把所有信息一股腦放到一個場景內 , 反而可能不合適 。


晚點:你能想到的使用場景有哪些?


陶芳波:我一下能想到的場景 , 包括讓 AI 身份代替我們自己去約會、去面試等等 。


此外 , 我們在打磨一個叫 “共鳴” 的功能 。 比如我們兩個第一次見面 , 或者隔段時間重逢 , 并不知道對方最近發生了什么 。 那么手機碰一碰 , 身份模型一瞬間就能同步 , 尋找共同經歷 , 然后針對性地聊幾回合 , 為我們破冰或者敘舊找個話頭 。 整個同步過程只要 5 到 10 秒 。


破冰之外 , 另一種 “共鳴” 是允許用戶每次在 Me.bot 里記錄想法時 , 也把想法發給其他相互匹配的身份模型 , 獲得具體、有深度的回復 。 如果用戶覺得回復有趣 , 還可以進一步和那些身份大模型或者大模型背后的真人交互 。


除了 “共鳴” , 還有一個馬上要上線的新功能叫 “Talks” , 它允許用戶把身份模型寄存在一個 H5 網頁里 , 分發給其他人 。 這頁面里的身份模型能用用戶的聲線講話 , 也可以和打開頁面的人語音交流 。


完成交流后 , 身份模型的所有者會收到交流紀要 , 總結紀要的過程是高度個性化的——你的身份模型了解有些信息你已經掌握 , 就不會在紀要中反復強調 。


晚點:為什么 Talks 選擇用聲音傳遞信息?無論是手機還是電腦屏幕上 , 文字傳輸信息的效率似乎比聲音高 。


陶芳波:我們覺得聲音的作用被大大低估了 。 一個很有意思的認知學現象是 , 如果有人用聲音和你交流 , 你的注意力會提高 。 比如打電話聊天會比打字聊天更專注 。 對用戶來說 , 具體、熟悉的人的聲音是有一種特殊的穿透力的 。


晚點:共鳴、Talks , 哪個是優先級更高的功能?


陶芳波:Talks 。 發生共鳴的前提是雙方都有身份模型 , Talks 則是讓真人先和身份模型聊起來 , 能讓更多人先看到身份模型的潛力 , 然后變成身份模型的用戶 。


晚點:你應該已經試用 Talks 一段時間了 , 使用過程中有什么啟發嗎?


陶芳波:“表達” 這件事情很重要、很日常 , 但人往往不太會表達 。


我一直把自己和一名朋友的聊天記錄存在 Me.bot 里 , 我們認識一周年時 , 我讓 Me.bot 總結我和他交流中各種感受和收獲 , 用我的聲音生成一段 talk 發給他 。


這名朋友聽了好幾遍 , 很感動 , 不斷地說我們的關系又被這段 talk 拉近了一點 。 其實真讓我和他坐一起 , 或者打電話說同樣的話 , 我會覺得有點肉麻 , 很多事情也不容易想起來 。


當然 Talks 的使用場景不只是表達情感 。 最近我和幾個合作伙伴的腦暴交流 , 都是用 Talks 完成的 。


晚點:可也有一種觀點認為 AI 不能代替人傳遞情感 。 情感反應在溝通前親自完成準備過程中 , 反應在溝通時磕磕絆絆、結結巴巴 , 甚至是笨拙的表達中 。


陶芳波:Talks 不替代溝通 , 但能讓溝通的門檻變低 。 寫幾句提示詞 , 身份模型就能把我真實想說的東西流利地說出來 , 反而可以增強人和人之間的連接 。


晚點:心識宇宙怎么培養用戶打開 Me.bot 記錄生活的習慣?


陶芳波:我們有個概念叫 “共生” 。 想讓用戶自然、無痛地用 Me.bot 記錄生活 , Me.bot 就必須一邊參與用戶生活 , 一邊創造價值 。 比如 Me.bot 參加會議 , 我們希望它不只像錄音軟件一樣旁聽 , 而可以根據對用戶的理解 , 時不時蹦出一些想法 , 參與討論 。


用戶每次打開 Me.bot 的時候 , 也應該有不同的體驗 。 比如早上起來 , Me.bot 可以問用戶今天心情還好嗎?到了北京 , 問怎么來北京了?要不要幫忙找個咖啡館?


不是用戶所有的生活細節都值得記錄 。 一天 24 小時里 , 可能人們注意力集中的時候只有不到 3 小時 , 這段時間才是真正塑造自我的時候 。 如果讓 AI 把所有信息捕獲下來 , 包括睡覺打呼嚕的聲音 , 那反而會讓身份模型更困惑 。


晚點:“共生” 是個很好的概念 , 但感覺這類交互場景下 , 用戶很難區分是在和 me , 還是和 him/her 交流 。


陶芳波:用戶和自己身份模型交互時 , me 和 him / her 體驗差別不大 。 但如果用戶和其他 AI 交互 , 或者 AI 和 AI 交互時 , 對面是代表一個人做決策、但也有自主性的 AI 管家 , 還是覺得自己就是另一個人的身份模型 , 其實是會影響用戶或者 AI 的信息分享策略的 。




人腦如何認識世界 , AI 就如何向人看齊




晚點:很多 AI 產品都試圖讓模型和用戶對齊 。 你覺得合理的路徑是什么?


陶芳波:首先我們不能完全依賴 RAG(檢索增強生成 , 即允許大語言模型在生成答案前 , 先根據用戶的輸入 , 搜索相關信息補充上下文) 。 RAG 本質是把用戶信息做成數據庫 , 要什么信息 , 去數據庫找一找 , 再把找到的信息作為上下文輸入模型 。


問題是一旦數據庫過大 , 模型不知道捕捉什么樣的信息才能代表用戶 。 假設你今年 30 歲 , 把 30 年的人生經歷匯總成上下文 , 那可能有好幾億 Token , 處理這些信息就 4-5 秒時間 , 模型不一定能很好地消化 。


更重要的是 , RAG 方法下 , 所有人的底層模型是一樣 , 而思考靠模型完成 , 這意味著本質上你和我沒有區別 。


人之所以為人 , 是因為人能把外在信息抽象、內化 。 類似地 , 讓模型與用戶對齊更合理的方式 , 是用用戶信息去微調模型 , 影響模型的參數 , 由此提煉出用戶數據中的情感、偏好、價值觀 。


晚點:一個用全世界數據訓練出的基礎模型 , 至少在知識層面已經遠超一個普通用戶了 。 微調參數 , 實際上是要讓模型忘掉一些已經習得的知識 , 才能和用戶對齊?


陶芳波:其實人成長也是基于一個基礎模型的 。 人出生時 , 大腦不是一片空白——幾千萬年進化改變的基因序列就是人的基礎模型 。 只不過真人的基礎模型可能知識過少 , 而我們用的基礎模型可能知識過多 。


微調不會讓模型百分之百忘掉習得的知識 , 但可以通過放大和你相關的部分、壓制不相關的部分 , 有效改變基礎模型的輸出結果 , 讓模型和用戶對齊 。


當然 , 無論是 LoRA(低秩適應 , 一種不改變模型主要參數、更加高效的模型微調方法)還是別的方法 , 我不覺得今天微調的技術已經完美 。 技術會持續演進 , 但通過改變參數的方式訓練身份模型的大方向是不變的 。


晚點:心識宇宙如何使用用戶數據訓練身份模型?


陶芳波:首先要把數據主觀化 。 直接把我們今天交流的錄音發給 AI , AI 只知道這是兩個人相互對話 , 主觀化處理是讓 AI 知道兩個人中誰是 “我” , “我” 表達了什么觀點、對方又產生了什么回應 。


然后還需要重構信息 。 人腦記不住今天你說什么、我說什么這樣的細節信息 , 而是圍繞著一個人、一件事情建立索引 。 我們處理數據的方法也類似 。 比如我上傳自己和朋友之間的聊天記錄后 , Me.bot 會在此基礎上提煉信息——我們的友情之前遭遇了什么挫折、之后又因為什么變得更牢固 , 圍繞著我的朋友串聯起更全局歷史數據 。


晚點:會有什么方式量化身份模型和人的相似程度嗎?


陶芳波:可以有一個指標 , 但我覺得每個人是自己模型最好的裁判 。


晚點:什么時候你覺得你的身份模型已經足夠像你了?
【AI 創業訪談?丨心識宇宙陶芳波:用一百份筆記,復刻 AI 版的自己】

陶芳波:去年我生日時在辦公室同事面前做分享 , 講自己從讀博士到 Facebook 的經歷、今天如何找到了自己人生的使命 。 剛好同事訓練好一版我的身份模型 , 就也讓這個模型做生日發言 , 說的和我真人講的幾乎一模一樣 。 之后我問他 MBTI 性格測試結果 , 只有一個和我不一樣 。


晚點:訓練一個身份模型需要多少數據?


陶芳波:一百份筆記或者一百份記錄就可以了 , 甚至更少 。 其實很多類似的數據已經存在 , 用戶只需要上傳就行 。


晚點:人的經歷不斷增加 , 自我認知隨之改變 。 身份模型如何跟上不斷變化的用戶?


陶芳波:我們覺得每天訓練一次身份模型比較合適 。 人腦白天獲得很多對話、新知識 , 它們只是被緩存在了一個地方 , 沒有變成持久記憶、參數化 。 睡眠過程中 , 人腦才會處理這些數據 。 身份模型也該這樣 , 白天記載信息 , 晚上訓練 。


晚點:訓練一次成本是多少?


陶芳波:現在我們用 70 億參數的模型 , 單次也就一美金不到 。 參數量再小 , 模型不夠聰明;再大 , 邊際回報有限 。




靠身份服務收費




晚點:身份模型可以代替用戶提出需求、和其他 AI 交互 。 但現在承接需求、完成任務的 AI 都不是很成熟 。 先做提需求的身份模型 , 時機成熟嗎?


陶芳波:之前提到的社交、面試、約會等需求 , 可以直接靠身份模型完成任務 , 這些需求場景已經夠大了 。


身份模型也不用非要面向 AI 。 之前互聯網公司已經創造了大量的場景 , 身份模型只要和它們互動起來就行 。 比如身份模型可以去 LinkedIn 幫你找工作 。 之后 Agent 能力提升了 , 再和 Agent 互動也順理成章 。


現在我們做了一個服務器叫 Second Me Server , 平臺如果希望了解用戶 , 就可以向 Second Me 發起請求 , 通過身份模型知道用戶的偏好是什么 。 這其實是可以無縫融入現有的互聯網生態中的 。


晚點:Second Me 和互聯網平臺的互動可能是單向的——他們愿意通過 Second Me 服務器了解用戶偏好 , 但不一定開放接口讓身份模型幫用戶購物 。


陶芳波:這是個比較現實的問題 。 現在海外的互聯網還相對開放 , 大家可以通過 API(數據接口)連接 。 國內就過于封閉了 , 一個個平臺就像一個個孤島 , 無法接入 , 大家都在搞數據壁壘 。


但這種孤立的狀態肯定會在 AI 時代被打破 。 孤島式生態無法提供很好的用戶體驗 , 用戶會倒逼平臺開放的 。 平臺不開放 , 新世界就與它無關了 。


晚點:你們把 Second Me 做成開源項目的價值是什么?


陶芳波:把訓練方法開源 , 用戶就能在本地訓練身份模型 , 然后把它接入互聯網 , 可以解決用戶使用個人數據的心理壁壘 。 另外也有成本方面的考慮 。 如果我們有 100 萬個用戶 , 就得訓練 100 萬個模型 , 服務器成本、存儲成本是無法想象的 。 開源之后 , 更多身份模型的用法其實也來自開源社區 。


晚點:這個開源項目的參與度如何?


陶芳波:GitHub 上有很多人關注 , 官方也在今年 4 月寫文章說 Second Me 是當時全站 Top 10 的項目 。 我們在三個星期內得到超過一萬個 star(類似用戶收藏) , 今年大概只有不到 20 個項目有這樣的增速 。


有開發者看到我們項目后 , 花 7 萬塊錢買一臺 Mac Studio , 就為了在本地訓練一版更強的自己 。 有用戶用跨時幾年、數百萬字的日記訓練出一個 AI 自我 , 把自己變永恒 。


晚點:身份模型如何商業化?


陶芳波:現在我們想得還不是很充分 。 核心思路是我們作為身份服務的提供者 , 可以向用戶收費 。 另一種可能是 , 要是淘寶、抖音等平臺未來通過我們的身份模型了解用戶偏好、賣廣告 , 我們也可以向這些平臺收費 。


晚點:構建身份模型時 , 已經有大量用戶數據的微信、抖音 , 或者理論上能記錄用戶一切操作的手機廠商 , 是不是做起來更快?


陶芳波:從數據的角度看肯定如此 。 但我們今天賭的是大公司內部創新的阻力 。 身份模型的早期使用者只會是一小群人 , 大廠不太可能為 1% 的用戶專門改變產品 , 因為影響剩下 99% 的用戶體驗的風險太高 。 淘寶要是抱著擁抱 AI 購物的念頭把整個應用界面都改了 , 只允許用戶和 AI 聊天購物 , 拼多多不得樂壞了?


晚點:身份模型之間可以交互 , 越多人用越好用 , 像一個傳統互聯網產品 。 Mindverse 有什么加速用戶增長的好辦法嗎?


陶芳波:買量不可持續 , 還是要靠口碑 。 口碑一是靠創造感 , 讓用戶覺得 “自己” 被創造出來;二是靠連接體驗 , 讓用戶能在產品上獲得高質量的連接 。 把這兩者做到極致 , 我覺得自然有好增長 。


晚點:如果所有人都有一個身份模型 , 會對社會有什么影響?


陶芳波:人人都有身份模型、AI 接替一部分人們相互交互的工作 , 相當于存在于現實中的社會網絡有了一個線上復制版 , 復制版的效率會比原版高很多 。


互聯網工具越來越多、越來越強大后 , 人反而成了工具的接口——微信、飛書、釘釘一個個隨時待命 , 等待被調用的人 。 用一個身份模型代替人成為這些工具的接口 , 個體就能被解放出來 。
題圖:《編號 17》

    推薦閱讀