半月談記者 郭方達
“具身智能”被認(rèn)為是人工智能競爭的重要領(lǐng)域。2025年的政府工作報告提出,建立未來產(chǎn)業(yè)投入增長機制,培育生物制造、量子科技、具身智能、6G等未來產(chǎn)業(yè)。行業(yè)數(shù)據(jù)顯示,2024年全球人形機器人新品發(fā)布數(shù)量已超過106款,遠(yuǎn)超過去20年的總和,與之相伴的“具身智能”概念成為全世界追捧的熱點。谷歌、特斯拉等一眾國際知名企業(yè)紛紛布局該賽道,波士頓動力、宇樹科技等新興企業(yè)的產(chǎn)品更是吸睛無數(shù)。
作為拓展人類能力邊界的“外骨骼”,具身智能的技術(shù)裂變究竟還有多遠(yuǎn)?
人形,不止于人形
“許多人第一次對具身智能有直觀印象,就是看見春晚舞臺上轉(zhuǎn)手絹的機器人?!碧旖虼髮W(xué)無人駕駛汽車交叉研究中心主任謝輝表示,人形機器人是該領(lǐng)域最具“顯示度”的產(chǎn)品,可通過類似人類的身體結(jié)構(gòu),執(zhí)行許多傳統(tǒng)任務(wù)。
事實上,任何能夠在物理空間中進行互動的機器人,都有望成為具身智能的載體,具身智能機器人的關(guān)鍵在于具身智能的底層技術(shù),而非機器人的物理形狀?!叭诵螜C器人是對于當(dāng)前物理環(huán)境的友好解決方案之一,但不會是針對所有場景的最優(yōu)方案,比如組裝一輛汽車,人形機器人的效率就很難比機械臂高?!碧旖蛐滤蓹C器人自動化有限公司總經(jīng)理高松表示,在工廠等結(jié)構(gòu)化場景中,具身智能有很多外形不一的載體。
具身智能依托軟件算法和物理載體,能夠感知環(huán)境、做出決策并執(zhí)行具體的任務(wù)。清華大學(xué)人工智能學(xué)院教授沈陽說,具身智能作為一種軟硬件一體的特殊智能體,依賴的是多模態(tài)模型?!氨热鏥LA大模型,V的視覺,L的語言,A的動作,形成一套感知決策行動的完整流程?!倍唐趦?nèi),車輛很有可能成為具身智能最先投入大規(guī)模應(yīng)用的領(lǐng)域?!巴ㄟ^傳感器進行視覺識別,大模型與用戶交互,最后落實在對汽車的機械操控上。”謝輝說。
從市場來看,全世界都對具身智能領(lǐng)域顯示出濃厚興趣。國際知名投資機構(gòu)高盛預(yù)測,2035年人形機器人全球市場規(guī)模將高達380億美元。我國北京、浙江、廣東等多省市已經(jīng)相繼出臺具身智能發(fā)展規(guī)劃,力圖打造領(lǐng)先的產(chǎn)業(yè)聚集區(qū)。工業(yè)和信息化部印發(fā)的《人形機器人創(chuàng)新發(fā)展指導(dǎo)意見》,提出到2027年產(chǎn)業(yè)綜合實力達到世界先進水平、成為重要的經(jīng)濟增長新引擎等發(fā)展目標(biāo)。
2025年3月21日,北京,中關(guān)村國際創(chuàng)新中心,入口咨詢臺在布置的具身智能機器人
具身智能“成人禮”尚未到來
——通用平臺和標(biāo)準(zhǔn)化認(rèn)證缺乏,多數(shù)企業(yè)陷入“重復(fù)造輪子”。國訊芯微(蘇州)科技有限公司首席技術(shù)官蔣琛表示,目前在具身智能領(lǐng)域,仍舊沒有統(tǒng)一的技術(shù)標(biāo)準(zhǔn)和通用開發(fā)平臺,這就使得多數(shù)企業(yè)都要從0到1獨立研發(fā),各地重復(fù)投入導(dǎo)致資源分散,影響產(chǎn)出效率。同時,硬件接口、通信協(xié)議、數(shù)據(jù)格式等缺乏統(tǒng)一規(guī)范,不同廠商的機器人本體構(gòu)型與軟件架構(gòu)互不兼容,制約規(guī)?;瘧?yīng)用。
——應(yīng)用場景開放度不足,缺乏快速孵化條件?!皺C器人最終還是要用起來?!碧旖蚶首u機器人有限公司董事長任志勇表示,研發(fā)端的企業(yè)和應(yīng)用行業(yè)尚未打通,許多實際工況都未能真正納入研發(fā)測試體系中,許多產(chǎn)品仍停留在“溫室花朵”的階段。高松認(rèn)為,具身智能要真正走入生活,還需要在眾多非結(jié)構(gòu)化場景中積累數(shù)據(jù),與ChatGPT等依賴文本數(shù)據(jù)的大模型不同,具身智能需采集真實物理環(huán)境的動態(tài)交互數(shù)據(jù),其采集成本更為高昂。
——核心元器件自主化程度不足,復(fù)合型人才缺口擴大。北京大學(xué)智能學(xué)院副院長林宙辰坦言,在高端GPU、精密傳感器、減速機等領(lǐng)域,我國企業(yè)的自主化程度依舊有待提高,對本土創(chuàng)新型人才的需求也隨之增加?!坝忠幊?,又要懂大模型,現(xiàn)在還要懂機械和自動化,這樣的人才太少太少?!敝x輝表示,伴隨著多領(lǐng)域的交叉融合,行業(yè)的人才要求從雙棲走向三棲,未來的門檻還將進一步提高。
——法律道德風(fēng)險仍是未解之題。謝輝舉例說,如果一臺被植入了惡意程序的智能車輛接入網(wǎng)絡(luò)中,可以生成并發(fā)送虛假的緊急消息,誤導(dǎo)周圍車輛的行駛路線、行車速度和前進方向等,從而制造交通擁堵與混亂,極端情況下甚至可以主動制造交通事故。對于這類智能機器可能造成損失的情況,責(zé)任歸屬邊界依舊模糊,開發(fā)者、運營者等主體責(zé)任幾何?這道“前置題”尚沒有答案。
產(chǎn)業(yè)競速先機何在
加強底層建設(shè),構(gòu)建龍頭引領(lǐng)共建的行業(yè)生態(tài)。蔣琛等人建議,加強具身智能領(lǐng)域的開放平臺建設(shè),在底層代碼、數(shù)據(jù)集等環(huán)節(jié)建立開源共享行業(yè)機制。主管部門宜組織龍頭企業(yè),鼓勵開發(fā)從硬件到軟件、從底層到應(yīng)用層、從AI模型底座到3D數(shù)據(jù)集的通用開發(fā)套件。盡快制定國家級具身智能發(fā)展規(guī)劃,加快標(biāo)準(zhǔn)建設(shè),創(chuàng)建生態(tài)認(rèn)證體系,推動技術(shù)加速迭代。
促進應(yīng)用場景開放,提供高質(zhì)量的現(xiàn)實數(shù)據(jù)。任志勇等人認(rèn)為,具身數(shù)據(jù)無法從互聯(lián)網(wǎng)海量內(nèi)容中直接獲取,而需通過真實的機器人操作來采集或高級仿真平臺生成,因此需要較高的采集成本和廣泛的應(yīng)用場景支持。建議在柔性生產(chǎn)、醫(yī)療康養(yǎng)、公共安全、應(yīng)急救援等領(lǐng)域開放政府、國企主導(dǎo)的應(yīng)用場景,為廣大企業(yè)提供測試平臺。
強化高校、科研院所、企業(yè)的聯(lián)合科研能力,為技術(shù)創(chuàng)新提供支撐。謝輝認(rèn)為,高校要打破學(xué)科專業(yè)壁壘,對現(xiàn)有學(xué)科專業(yè)體系進行調(diào)整升級,重視跨學(xué)科課程建設(shè)和人才培養(yǎng)項目,如推出“人工智能+X”雙學(xué)位項目等,打破傳統(tǒng)學(xué)科專業(yè)界限,培養(yǎng)一批適宜人工智能領(lǐng)域的復(fù)合型人才。
加速建設(shè)前置治理體系,完善法律等安全防線。業(yè)內(nèi)人士認(rèn)為,構(gòu)建責(zé)任明晰的治理框架,是具身智能安全投用的重要保障。一方面應(yīng)在隱私數(shù)據(jù)保護、責(zé)任歸屬等方面進行充分論證并出臺相關(guān)法律法規(guī),避免監(jiān)管真空;另一方面則應(yīng)建立人工智能領(lǐng)域的預(yù)警及應(yīng)急熔斷機制,盡可能將風(fēng)險及影響降至最低。
編輯:尤立