日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

具身智能卡在觸覺,一目科技布局全鏈路,打造機(jī)器人指尖上的感知

具身智能卡在觸覺,一目科技布局全鏈路,打造機(jī)器人指尖上的感知

文章圖片



過去一年 , 具身智能的發(fā)展堪稱“狂飆” , 各大機(jī)構(gòu)和企業(yè)紛紛投入世界模型與VLA(視覺-語言-動作模型)的研發(fā) 。 但在AI行業(yè)老兵、一目科技創(chuàng)始人兼CEO李智強(qiáng)看來 , 這些模型仍有明顯缺失 。 如果機(jī)器人能像人一樣理解并操作這個世界 , 仍差關(guān)鍵的一感:觸覺 。
基于這樣的判斷 , 一目科技進(jìn)行了從底層傳感器到仿真算法的全鏈路布局 , 探索打造“觸覺增強(qiáng)的世界模型” 。
01
“世界模型”還缺什么?
【具身智能卡在觸覺,一目科技布局全鏈路,打造機(jī)器人指尖上的感知】如果將AI發(fā)展與人的五感對比 , AI的“聽覺”2015年已日趨成熟 , 視覺在過去10年也越來越發(fā)達(dá) , 但嗅覺、味覺和觸覺仍處于空白 。
李智強(qiáng)博士分析 , 在具身智能要解決的行動力、智力和精細(xì)化操作三大問題中 , 尤其精細(xì)化操作 , 離不開閉環(huán)感知能力 。 “如果只有視覺 , 在特定場景下會失效 , 比如根本無法夾取薯片這類脆性物體 。 ”
他認(rèn)為 , 世界模型要真正理解物理世界 , 必須補(bǔ)足觸覺維度 , 因?yàn)槿藢ξ镔|(zhì)世界的認(rèn)知 , 正是源于不斷觸摸試探 , 在大腦中建立與物理世界的映射 。 “如果有一天 , 機(jī)器人能通過持續(xù)觸碰與探索形成類人感知 , 便是世界模型達(dá)成終極目標(biāo)的時刻 。 ”
而這也正是一目科技的創(chuàng)業(yè)初心 , “把類人的五感賦予機(jī)器里” , 通過感知驅(qū)動“物理AI”的發(fā)展 。 李智強(qiáng)在卡內(nèi)基梅隆大學(xué)攻讀博士期間 , 研究方向是光譜儀芯片化及AI算法 , “可以類比于人類的嗅覺和味覺 。 因?yàn)槿说男嵊X、味覺主要是分子層面的一些感受和分析” , 這也自然延伸到硬科技與物理AI的結(jié)合 。
一目科技2015年成立于硅谷 , 2016年選擇回國創(chuàng)業(yè) , 原因是“物理AI”方向?qū)τ布蕾嚇O高 , 而中國在設(shè)計、制造工藝上優(yōu)勢顯著 。 “比如設(shè)計一塊電路板 , 國內(nèi)七八天就能完成 , 在美國可能要三四個月 。 ”
如今 , 經(jīng)過學(xué)術(shù)界長達(dá)十多年的研究 , 以及一目科技的實(shí)踐 , 均已驗(yàn)證:具備觸覺后 , 機(jī)器人可完成夾薯片、穿針引線、拿起布料等操作 , 動作絲滑 , 這正是具身智能精細(xì)化操作的起點(diǎn) 。 觸覺 , 正是世界模型走向完整的必由之路 。
02
手指尖上的觸覺“覺醒”
要讓世界模型擁有“觸覺” , 離不開觸覺數(shù)據(jù)的采集與感知技術(shù)的突破 。 “核心卡在傳感器上” 。
一目科技創(chuàng)業(yè)的第一階段 , 著眼于分子光譜儀的芯片化 , 實(shí)現(xiàn)分子分析能力的AI化 。 團(tuán)隊(duì)花了四五年進(jìn)行芯片研發(fā)、設(shè)計和流片 , 2020年推出首個產(chǎn)品線 , 應(yīng)用于實(shí)驗(yàn)室和水質(zhì)檢測等場景 。 該產(chǎn)品線現(xiàn)已進(jìn)入穩(wěn)定期 , 實(shí)現(xiàn)持續(xù)盈利 , 為公司提供了寶貴的“造血能力” 。
憑借在傳感器方面的積累 , 兩年前 , 一目科技開始向“觸覺增強(qiáng)”邁進(jìn) , 啟動視觸覺傳感器的研發(fā) , 希望“通過視觸覺傳感器 , 讓機(jī)器人真正能夠觸摸這個世界” 。
2025年10月 , 在全球機(jī)器人頂會IROS上 , 一目科技展示了自主研發(fā)的全球最薄可商用仿生視觸覺傳感器 。 該傳感器的核心在于“通過內(nèi)置攝像頭捕捉彈性材料接觸物體時的細(xì)微形變 , 獲取高清的‘觸覺照片’序列 , 并通過AI解算出觸覺信號” 。 不同于只能感知單一壓力的傳統(tǒng)傳感器 , 這款產(chǎn)品能同時“感受”物體的軟硬、表面紋理乃至滑動趨勢 。

一目科技仿生視觸覺傳感器
李智強(qiáng)博士介紹 , 這一傳感器實(shí)現(xiàn)了四個行業(yè)突破:其厚度僅為美國競品的一半 , 解決了傳統(tǒng)視觸覺傳感器因過厚 , 難以與靈巧手集成的行業(yè)痛點(diǎn);克服了“溫漂”問題;工業(yè)級防塵達(dá)到IP65級;傳感器接觸面都沒有盲區(qū) , 而競品有10%到20%的盲區(qū) 。 此外 , 其響應(yīng)時間僅8毫秒 , 可實(shí)現(xiàn)5毫牛級的多向力分辨 , 在多項(xiàng)性能上與全球最好水平持平 。

一目科技CEO&創(chuàng)始人李智強(qiáng)
這款觸覺傳感器分辨率極高——可達(dá)數(shù)百萬個像素 , 相當(dāng)于手指尖擁有數(shù)百萬個觸點(diǎn) 。 得益于信號的高保真與數(shù)據(jù)的高準(zhǔn)確度 , 能夠解算出高精度的觸覺信息 , 賦能機(jī)器人靈巧手的操作過程 。
據(jù)悉 , 產(chǎn)品一經(jīng)發(fā)布就獲得多方合作和訂單 , 團(tuán)隊(duì)預(yù)計未來一年出貨量能躋身行業(yè)頭部 , “至少Top3的水平” 。
不過 , 李智強(qiáng)博士也指出 , 目前許多機(jī)器人 , 包括人形機(jī)器人 , 雖然需要觸覺傳感硬件 , 但現(xiàn)有的世界模型和VLA模型仍未構(gòu)建觸覺感知的算法能力 。 為此 , 團(tuán)隊(duì)需要再進(jìn)一步外延 , “借助觸覺 , 打通機(jī)器人精細(xì)操作的最后一環(huán)” 。
03
打通觸覺到世界模型的鏈路
“我們未必自己去開發(fā)一整套世界模型 , 但是我們希望用觸覺來增強(qiáng)世界模型 。 ”李智強(qiáng)博士將這種理念概括為“觸覺增強(qiáng)的世界模型” 。 團(tuán)隊(duì)主張“站在巨人的肩膀之上” , 例如基于李飛飛團(tuán)隊(duì)發(fā)布的世界模型、阿里發(fā)布的VLM開源模型等 , 一目科技會在這些模型基礎(chǔ)上進(jìn)行補(bǔ)充和增強(qiáng) 。
這項(xiàng)工作首先要解決數(shù)據(jù)采集難與數(shù)據(jù)量不足兩大難題 。 一目科技提出了“以真實(shí)觸覺信號錨定仿真系統(tǒng)”的閉環(huán)路徑 。
“我們靠人一條條采集出來的真實(shí)數(shù)據(jù) , 其實(shí)在10萬條級別 , 這個量對處理工作量來說很大 , 但對于大模型來說還是遠(yuǎn)遠(yuǎn)不夠 。 ”李智強(qiáng)博士坦言 , 目前開源社區(qū)也有數(shù)十萬條觸覺數(shù)據(jù) , 但也是杯水車薪 。
為突破數(shù)據(jù)瓶頸 , 一目科技在真實(shí)數(shù)據(jù)基礎(chǔ)上 , 引入物理仿真與生成式AI結(jié)合的策略來擴(kuò)展數(shù)據(jù) 。 團(tuán)隊(duì)有專家團(tuán)隊(duì) , 利用有限元模型 , 將“桌子或鼠標(biāo)”等物體在形態(tài)、硬度、摩擦力等維度上 , 用方程式仿真出來 。 “同時 , 我們還通過生成式AI去增加更多場景 , 比如光照、紋理、擺放位置和方向等 , 去做仿真的擴(kuò)大化和無序化 。 ”
從效果反饋看 , 物理仿真準(zhǔn)確度更高 , “因?yàn)樗澈笫俏锢矸匠?, 誤差較小”;而生成式AI則“有一些幻覺 , 對物理規(guī)律的理解也有一定差距” 。 因此 , 團(tuán)隊(duì)持續(xù)優(yōu)化物理模型 , 并隨著生成式AI的進(jìn)步 , 引入新模型和方法 , “不斷改進(jìn)增強(qiáng)模擬數(shù)據(jù)的質(zhì)量” 。
有了這些物理仿真數(shù)據(jù)后 , 相當(dāng)于在虛擬空間中搭建了一個可被“觸摸”的世界 。 接下來要做的 , 便是讓AI在仿真環(huán)境中去“觸碰”它們 , 采集觸覺信息 。
一目科技采用視觸覺方式來完成這一過程 。 不同于傳統(tǒng)靠壓力或電阻的觸覺傳感器 , 視觸覺方式不僅能“感覺”壓力 , 內(nèi)部攝像頭還會捕捉到形變和光線的細(xì)微變化 , 從受力到光線變化再到力分布 , 完整還原觸感生成的全過程 。 一目科技構(gòu)建了視觸覺傳感器模型 , 輸出的數(shù)字信號包含了紋理、形態(tài)、力方向等信息 , 來接入VLA與世界模型 。
通過這種仿真增強(qiáng)方式 , 一目科技希望將觸覺數(shù)據(jù)量擴(kuò)展百倍以上 。 “只有這樣 , 才能真正走上Scaling(規(guī)模化)的道路 。 ”
完成數(shù)據(jù)擴(kuò)展后 , 下一步是將觸覺與視覺、語言等模態(tài)對齊 , 真正融入世界模型 。 具體而言 , 現(xiàn)有世界模型多圍繞視覺與語言分配“token” , 而一目科技的創(chuàng)新在于“引入新的觸覺token” , 通過訓(xùn)練增強(qiáng)模型的多模態(tài)理解能力 , 打通感知鏈路 。
“其實(shí)后半部分和目前的大模型訓(xùn)練類似 , 市場上已有大量模型預(yù)訓(xùn)練、精調(diào)、強(qiáng)化學(xué)習(xí)的方法 。 ”李智強(qiáng)博士介紹 , “最終我們還會去做一些測試、驗(yàn)證方法 。 ”
實(shí)際上 , 真正的挑戰(zhàn)不在于訓(xùn)練方法 , 而在于觸覺數(shù)據(jù)與其他模態(tài)的關(guān)系及對齊 。 當(dāng)觸覺、視覺等信息同時出現(xiàn)時 , 哪個可信度更高?該如何做綜合決策?這些信息的關(guān)聯(lián)度是什么?能否在同一域?qū)崿F(xiàn)對齊?一目科技的創(chuàng)新重點(diǎn)正是圍繞觸覺信息的處理、對齊及其對決策的影響展開 。
這一階段恰似20年前視覺模型的起點(diǎn) 。 就像20前做視覺模型時攝像頭還不健全一樣 , 現(xiàn)在的觸覺感知也剛剛起步 。 “隨著傳感器的不斷迭代和性能提升 , 這一切都將迎來改變 。 ”
04
在狂飆的AI浪潮中站穩(wěn)
人工智能的演進(jìn)速度驚人 。 李智強(qiáng)回國創(chuàng)業(yè)時 , 正逢國內(nèi)視覺AI熱潮 。 當(dāng)時 , 技術(shù)發(fā)展迅猛 , 但隨著市場的快速變化 , 許多企業(yè)也被迅速淘汰 。 而如何在這一輪具身智能的激烈競爭中占據(jù)一席之地?他認(rèn)為 , 關(guān)鍵在于技術(shù)壁壘和市場定位 。
“必須構(gòu)建足夠高的技術(shù)壁壘 , 特別是技術(shù)的不可復(fù)制性或不可替代性 。 ”對一目科技而言 , 從感知傳感器硬件到算法做全鏈路技術(shù)布局 , 而且要做到全球領(lǐng)先 , 技術(shù)壁壘才足夠高 。
市場選擇也同樣至關(guān)重要 。 “最好是找到那些巨頭難以覆蓋 , 或者不主要依賴客戶關(guān)系的細(xì)分市場 。 ”他說 , “找到自己的生態(tài)位 , 并在技術(shù)上保持不可替代性 , 才是成功的關(guān)鍵 。 ”
對于一目科技來說 , 團(tuán)隊(duì)投入最多的是有限元仿真和光學(xué)仿真上 。 “作為創(chuàng)業(yè)公司 , 我們選擇將業(yè)務(wù)收斂到極其細(xì)分、高度專業(yè)化的賽道 。 ”
放眼全球業(yè)界 , 目前 , 真正做“觸覺增強(qiáng)世界模型”的團(tuán)隊(duì)仍然稀少 。 早期Meta做過一些工作 , 但主要還是純觸覺領(lǐng)域 。 “我們尚未看到真正與世界模型深度打通的案例 。 ”李智強(qiáng)博士直言 , “在觸覺與世界模型打通這一方向上 , 還有大量工作要做 , 現(xiàn)在仍嚴(yán)重不足 。 ”
一目科技規(guī)劃了循序漸進(jìn)的路徑 。 第一階段基于開源模型 , 自己進(jìn)行改造 。 當(dāng)達(dá)到良好效果后 , 將開放部分模型和數(shù)據(jù)集 , 回饋開源社區(qū) 。 這將是第二階段的事情 。 而從長遠(yuǎn)來看 , 有必要與一些模型巨頭企業(yè)合作 , 更早地將觸覺增強(qiáng)技術(shù)結(jié)合到他們的模型訓(xùn)練中去 , 這樣 , 效果要好于模型成型后的再調(diào)整 。 目前 , 一目科技正處于第一階段 , 預(yù)估跑通整個鏈路 , 需要9至12個月時間 。
李智強(qiáng)告訴數(shù)智前線 , 未來5到10年將圍繞這一主題做產(chǎn)品規(guī)劃和投資 。 他認(rèn)為 , 中國在“硬件+軟件”融合模式下具有顯著優(yōu)勢 , 這也為身處其中的行業(yè)和企業(yè)帶來了極有前景的發(fā)展機(jī)遇 。

    推薦閱讀