具身智能卡在觸覺，一目科技布局全鏈路，打造機(jī)器人指尖上的感知_傳感器|ai|具身智能|人工智能

文章圖片

過去一年，具身智能的發(fā)展堪稱“狂飆” ，各大機(jī)構(gòu)和企業(yè)紛紛投入世界模型與VLA（視覺-語言-動作模型）的研發(fā) 。但在AI行業(yè)老兵、一目科技創(chuàng)始人兼CEO李智強(qiáng)看來，這些模型仍有明顯缺失。如果機(jī)器人能像人一樣理解并操作這個世界，仍差關(guān)鍵的一感：觸覺。
基于這樣的判斷，一目科技進(jìn)行了從底層傳感器到仿真算法的全鏈路布局，探索打造“觸覺增強(qiáng)的世界模型” 。
01
“世界模型”還缺什么？
【具身智能卡在觸覺，一目科技布局全鏈路，打造機(jī)器人指尖上的感知】如果將AI發(fā)展與人的五感對比， AI的“聽覺”2015年已日趨成熟，視覺在過去10年也越來越發(fā)達(dá) ，但嗅覺、味覺和觸覺仍處于空白。
李智強(qiáng)博士分析，在具身智能要解決的行動力、智力和精細(xì)化操作三大問題中，尤其精細(xì)化操作，離不開閉環(huán)感知能力。 “如果只有視覺，在特定場景下會失效，比如根本無法夾取薯片這類脆性物體。 ”
他認(rèn)為，世界模型要真正理解物理世界，必須補(bǔ)足觸覺維度，因?yàn)槿藢ξ镔|(zhì)世界的認(rèn)知，正是源于不斷觸摸試探，在大腦中建立與物理世界的映射。 “如果有一天，機(jī)器人能通過持續(xù)觸碰與探索形成類人感知，便是世界模型達(dá)成終極目標(biāo)的時刻。 ”
而這也正是一目科技的創(chuàng)業(yè)初心， “把類人的五感賦予機(jī)器里” ，通過感知驅(qū)動“物理AI”的發(fā)展。李智強(qiáng)在卡內(nèi)基梅隆大學(xué)攻讀博士期間，研究方向是光譜儀芯片化及AI算法， “可以類比于人類的嗅覺和味覺。因?yàn)槿说男嵊X、味覺主要是分子層面的一些感受和分析” ，這也自然延伸到硬科技與物理AI的結(jié)合。
一目科技2015年成立于硅谷， 2016年選擇回國創(chuàng)業(yè) ，原因是“物理AI”方向?qū)τ布蕾嚇O高，而中國在設(shè)計、制造工藝上優(yōu)勢顯著。 “比如設(shè)計一塊電路板，國內(nèi)七八天就能完成，在美國可能要三四個月。 ”
如今，經(jīng)過學(xué)術(shù)界長達(dá)十多年的研究，以及一目科技的實(shí)踐，均已驗(yàn)證：具備觸覺后，機(jī)器人可完成夾薯片、穿針引線、拿起布料等操作，動作絲滑，這正是具身智能精細(xì)化操作的起點(diǎn) 。觸覺，正是世界模型走向完整的必由之路。
02
手指尖上的觸覺“覺醒”
要讓世界模型擁有“觸覺” ，離不開觸覺數(shù)據(jù)的采集與感知技術(shù)的突破。 “核心卡在傳感器上” 。
一目科技創(chuàng)業(yè)的第一階段，著眼于分子光譜儀的芯片化，實(shí)現(xiàn)分子分析能力的AI化。團(tuán)隊(duì)花了四五年進(jìn)行芯片研發(fā)、設(shè)計和流片， 2020年推出首個產(chǎn)品線，應(yīng)用于實(shí)驗(yàn)室和水質(zhì)檢測等場景。該產(chǎn)品線現(xiàn)已進(jìn)入穩(wěn)定期，實(shí)現(xiàn)持續(xù)盈利，為公司提供了寶貴的“造血能力” 。
憑借在傳感器方面的積累，兩年前，一目科技開始向“觸覺增強(qiáng)”邁進(jìn) ，啟動視觸覺傳感器的研發(fā) ，希望“通過視觸覺傳感器，讓機(jī)器人真正能夠觸摸這個世界” 。
2025年10月，在全球機(jī)器人頂會IROS上，一目科技展示了自主研發(fā)的全球最薄可商用仿生視觸覺傳感器。該傳感器的核心在于“通過內(nèi)置攝像頭捕捉彈性材料接觸物體時的細(xì)微形變，獲取高清的‘觸覺照片’序列，并通過AI解算出觸覺信號” 。不同于只能感知單一壓力的傳統(tǒng)傳感器，這款產(chǎn)品能同時“感受”物體的軟硬、表面紋理乃至滑動趨勢。

一目科技仿生視觸覺傳感器
李智強(qiáng)博士介紹，這一傳感器實(shí)現(xiàn)了四個行業(yè)突破：其厚度僅為美國競品的一半，解決了傳統(tǒng)視觸覺傳感器因過厚，難以與靈巧手集成的行業(yè)痛點(diǎn)；克服了“溫漂”問題；工業(yè)級防塵達(dá)到IP65級；傳感器接觸面都沒有盲區(qū) ，而競品有10%到20%的盲區(qū) 。此外，其響應(yīng)時間僅8毫秒，可實(shí)現(xiàn)5毫牛級的多向力分辨，在多項(xiàng)性能上與全球最好水平持平。

一目科技CEO＆創(chuàng)始人李智強(qiáng)
這款觸覺傳感器分辨率極高——可達(dá)數(shù)百萬個像素，相當(dāng)于手指尖擁有數(shù)百萬個觸點(diǎn) 。得益于信號的高保真與數(shù)據(jù)的高準(zhǔn)確度，能夠解算出高精度的觸覺信息，賦能機(jī)器人靈巧手的操作過程。
據(jù)悉，產(chǎn)品一經(jīng)發(fā)布就獲得多方合作和訂單，團(tuán)隊(duì)預(yù)計未來一年出貨量能躋身行業(yè)頭部， “至少Top3的水平” 。
不過，李智強(qiáng)博士也指出，目前許多機(jī)器人，包括人形機(jī)器人，雖然需要觸覺傳感硬件，但現(xiàn)有的世界模型和VLA模型仍未構(gòu)建觸覺感知的算法能力。為此，團(tuán)隊(duì)需要再進(jìn)一步外延， “借助觸覺，打通機(jī)器人精細(xì)操作的最后一環(huán)” 。
03
打通觸覺到世界模型的鏈路
“我們未必自己去開發(fā)一整套世界模型，但是我們希望用觸覺來增強(qiáng)世界模型。 ”李智強(qiáng)博士將這種理念概括為“觸覺增強(qiáng)的世界模型” 。團(tuán)隊(duì)主張“站在巨人的肩膀之上” ，例如基于李飛飛團(tuán)隊(duì)發(fā)布的世界模型、阿里發(fā)布的VLM開源模型等，一目科技會在這些模型基礎(chǔ)上進(jìn)行補(bǔ)充和增強(qiáng) 。
這項(xiàng)工作首先要解決數(shù)據(jù)采集難與數(shù)據(jù)量不足兩大難題。一目科技提出了“以真實(shí)觸覺信號錨定仿真系統(tǒng)”的閉環(huán)路徑。
“我們靠人一條條采集出來的真實(shí)數(shù)據(jù) ，其實(shí)在10萬條級別，這個量對處理工作量來說很大，但對于大模型來說還是遠(yuǎn)遠(yuǎn)不夠。 ”李智強(qiáng)博士坦言，目前開源社區(qū)也有數(shù)十萬條觸覺數(shù)據(jù) ，但也是杯水車薪。
為突破數(shù)據(jù)瓶頸，一目科技在真實(shí)數(shù)據(jù)基礎(chǔ)上，引入物理仿真與生成式AI結(jié)合的策略來擴(kuò)展數(shù)據(jù) 。團(tuán)隊(duì)有專家團(tuán)隊(duì) ，利用有限元模型，將“桌子或鼠標(biāo)”等物體在形態(tài)、硬度、摩擦力等維度上，用方程式仿真出來。 “同時，我們還通過生成式AI去增加更多場景，比如光照、紋理、擺放位置和方向等，去做仿真的擴(kuò)大化和無序化。 ”
從效果反饋看，物理仿真準(zhǔn)確度更高， “因?yàn)樗澈笫俏锢矸匠?，誤差較小”；而生成式AI則“有一些幻覺，對物理規(guī)律的理解也有一定差距” 。因此，團(tuán)隊(duì)持續(xù)優(yōu)化物理模型，并隨著生成式AI的進(jìn)步，引入新模型和方法， “不斷改進(jìn)增強(qiáng)模擬數(shù)據(jù)的質(zhì)量” 。
有了這些物理仿真數(shù)據(jù)后，相當(dāng)于在虛擬空間中搭建了一個可被“觸摸”的世界。接下來要做的，便是讓AI在仿真環(huán)境中去“觸碰”它們，采集觸覺信息。
一目科技采用視觸覺方式來完成這一過程。不同于傳統(tǒng)靠壓力或電阻的觸覺傳感器，視觸覺方式不僅能“感覺”壓力，內(nèi)部攝像頭還會捕捉到形變和光線的細(xì)微變化，從受力到光線變化再到力分布，完整還原觸感生成的全過程。一目科技構(gòu)建了視觸覺傳感器模型，輸出的數(shù)字信號包含了紋理、形態(tài)、力方向等信息，來接入VLA與世界模型。
通過這種仿真增強(qiáng)方式，一目科技希望將觸覺數(shù)據(jù)量擴(kuò)展百倍以上。 “只有這樣，才能真正走上Scaling（規(guī)模化）的道路。 ”
完成數(shù)據(jù)擴(kuò)展后，下一步是將觸覺與視覺、語言等模態(tài)對齊，真正融入世界模型。具體而言，現(xiàn)有世界模型多圍繞視覺與語言分配“token” ，而一目科技的創(chuàng)新在于“引入新的觸覺token” ，通過訓(xùn)練增強(qiáng)模型的多模態(tài)理解能力，打通感知鏈路。
“其實(shí)后半部分和目前的大模型訓(xùn)練類似，市場上已有大量模型預(yù)訓(xùn)練、精調(diào)、強(qiáng)化學(xué)習(xí)的方法。 ”李智強(qiáng)博士介紹， “最終我們還會去做一些測試、驗(yàn)證方法。 ”
實(shí)際上，真正的挑戰(zhàn)不在于訓(xùn)練方法，而在于觸覺數(shù)據(jù)與其他模態(tài)的關(guān)系及對齊。當(dāng)觸覺、視覺等信息同時出現(xiàn)時，哪個可信度更高？該如何做綜合決策？這些信息的關(guān)聯(lián)度是什么？能否在同一域?qū)崿F(xiàn)對齊？一目科技的創(chuàng)新重點(diǎn)正是圍繞觸覺信息的處理、對齊及其對決策的影響展開。
這一階段恰似20年前視覺模型的起點(diǎn) 。就像20前做視覺模型時攝像頭還不健全一樣，現(xiàn)在的觸覺感知也剛剛起步。 “隨著傳感器的不斷迭代和性能提升，這一切都將迎來改變。 ”
04
在狂飆的AI浪潮中站穩(wěn)
人工智能的演進(jìn)速度驚人。李智強(qiáng)回國創(chuàng)業(yè)時，正逢國內(nèi)視覺AI熱潮。當(dāng)時，技術(shù)發(fā)展迅猛，但隨著市場的快速變化，許多企業(yè)也被迅速淘汰。而如何在這一輪具身智能的激烈競爭中占據(jù)一席之地？他認(rèn)為，關(guān)鍵在于技術(shù)壁壘和市場定位。
“必須構(gòu)建足夠高的技術(shù)壁壘，特別是技術(shù)的不可復(fù)制性或不可替代性。 ”對一目科技而言，從感知傳感器硬件到算法做全鏈路技術(shù)布局，而且要做到全球領(lǐng)先，技術(shù)壁壘才足夠高。
市場選擇也同樣至關(guān)重要。 “最好是找到那些巨頭難以覆蓋，或者不主要依賴客戶關(guān)系的細(xì)分市場。 ”他說， “找到自己的生態(tài)位，并在技術(shù)上保持不可替代性，才是成功的關(guān)鍵。 ”
對于一目科技來說，團(tuán)隊(duì)投入最多的是有限元仿真和光學(xué)仿真上。 “作為創(chuàng)業(yè)公司，我們選擇將業(yè)務(wù)收斂到極其細(xì)分、高度專業(yè)化的賽道。 ”
放眼全球業(yè)界，目前，真正做“觸覺增強(qiáng)世界模型”的團(tuán)隊(duì)仍然稀少。早期Meta做過一些工作，但主要還是純觸覺領(lǐng)域。 “我們尚未看到真正與世界模型深度打通的案例。 ”李智強(qiáng)博士直言， “在觸覺與世界模型打通這一方向上，還有大量工作要做，現(xiàn)在仍嚴(yán)重不足。 ”
一目科技規(guī)劃了循序漸進(jìn)的路徑。第一階段基于開源模型，自己進(jìn)行改造。當(dāng)達(dá)到良好效果后，將開放部分模型和數(shù)據(jù)集，回饋開源社區(qū) 。這將是第二階段的事情。而從長遠(yuǎn)來看，有必要與一些模型巨頭企業(yè)合作，更早地將觸覺增強(qiáng)技術(shù)結(jié)合到他們的模型訓(xùn)練中去，這樣，效果要好于模型成型后的再調(diào)整。目前，一目科技正處于第一階段，預(yù)估跑通整個鏈路，需要9至12個月時間。
李智強(qiáng)告訴數(shù)智前線，未來5到10年將圍繞這一主題做產(chǎn)品規(guī)劃和投資。他認(rèn)為，中國在“硬件+軟件”融合模式下具有顯著優(yōu)勢，這也為身處其中的行業(yè)和企業(yè)帶來了極有前景的發(fā)展機(jī)遇。

具身智能卡在觸覺，一目科技布局全鏈路，打造機(jī)器人指尖上的感知

推薦閱讀

1338大寫

剎車片上的鐵絲有用嗎作用是什么呢

伴娘能當(dāng)幾次

真有壯陽藥嗎

淘寶618啥意思

微信說話沒有聲音怎么恢復(fù)正常蘋果手機(jī) 微信說話沒有聲音怎么恢復(fù)

睡涼席背疼怎么回事

微信怎么群發(fā)消息微信如何群發(fā)消息

住房公職金每月幾號增加住房公積金什么時候繳納

商品詳情頁怎么制作

最全論文答辯準(zhǔn)備,論文答辯該怎么準(zhǔn)備什么問題

15以內(nèi)最好抽的煙是什么煙最好抽的煙

滅神vip10出什么,諸天神魔亂世之斗《九曲封神》正式公測

第二次用錘科的手機(jī)。還是有些擔(dān)心。畢竟。。。

我的白阿姨屏幕失靈

孕蛋糕看孕婦蛋糕怎么做？