訂閱
糾錯
加入自媒體

具身智能火了,但規(guī)模落地還需時間

2024-09-24 09:17
洞見新研社
關注

作者 | 辰紋

來源 | 洞見新研社

人工智能下一個浪潮是具身智能,即能理解、推理并與物理世界互動的智能系統(tǒng)”, 英偉達CEO黃仁勛去年在ITF World 2023半導體大會上的預測正在成為現(xiàn)實。

5月份,日本橫濱召開的國際頂級機器人學術會議(ICRA2024)上,人形機器人扎堆亮相。

7月份,上海世界人工智能大會(WAIC 2024)展出人形機器人“十八金剛”是整個大會“最靚的仔”。

8月份,在北京閉幕的世界機器人大會中,人形機器人成為當之無愧的“C位”主角,官方表示,這是人形機器人數(shù)量最多的一屆大會,并且,現(xiàn)場有超過一半的觀眾都集中在人形機器人公司的展臺。

很顯然,和大模型一樣,作為具身智能最重要的實體形態(tài),人形機器人正在走向人工智能的舞臺中央。

以上展出的各類機器人“能文能武”,會寫字,會洗衣,做家務更是十項全能;能打詠春,能做拳擊陪練,也能成為貼身保鏢。

從場面上看,很熱鬧,但深入內(nèi)里,這么火的具身智能,亦或是人形機器人,距離“憑本事吃飯”還有多遠呢?

01 大模型帶火機器人

在進行我們的討論之前,首先要明確,什么是具身智能?

根據(jù)具身智能的英文翻譯(Embodied artificial intelligence,EAI)可以發(fā)現(xiàn),“本體”和“智能體”是兩個非常重要的構(gòu)成,具有“感知決策、物理實體、環(huán)境交互”的特征。

直白一點的理解就是,具身智能可以感知并理解周圍環(huán)境,在物理環(huán)境中執(zhí)行具體任務。

事實上,早在60多年前,自動化技術的先驅(qū)者歐姆龍公司就提出了“機器能做的事情讓機器去做,人類應該從事富有創(chuàng)造性的活動”的觀點,但終因技術尚未成熟,空有美好想法卻難以落地。

從2022年開始,具身智能迎來了新一輪的發(fā)展期,背后的核心變量是大模型的發(fā)展。

8月2日,初創(chuàng)公司Figure AI發(fā)布人形機器人Figure02,在與OpenAI合作開發(fā)的AI模型的支持下,F(xiàn)igure02的對話交互更具實時性、常識推理能力也更加到位。

很顯然,大模型技術為人形機器人實現(xiàn)更優(yōu)的感知、決策、交互能力提供了技術基礎,同樣也為機器人實現(xiàn)大腦感知決策,小腦運動控制的泛化性帶來了非常大的想象空間。

另外一面,人形機器人的硬件技術方面也有了長足的進步,2023年末特斯拉發(fā)布的Optimus Gen2搭載自研執(zhí)行器,足部采用鉸鏈式連接并配備力傳感器,使得Gen2的行走速度較Gen1提升30%并具備更好的平衡性。

更加重要的是,特斯拉發(fā)布Optimus后,帶動公司股價連續(xù)11個交易日收高,馬斯克的身價也在這段期間膨脹了約670億美元,進一步驗證了市場對人形機器人商業(yè)化的前景,從而將科技圈的關注焦點又重新拉回到具身智能。

這里主要體現(xiàn)在三個方面。

一是全國各國政府在政策層面的引導。

其中,中國政策的短期目標在于實現(xiàn)核心零部件的技術突破,長期目標在于豐富產(chǎn)業(yè)應用和生態(tài);海外的政策更多集中在前沿技術的攻關以及重要場景的落地等方面。

中國人形機器人重要政策梳理  資料來源:各政府網(wǎng)站,中金公司研究部

二是下場的玩家多元,且競爭愈發(fā)激烈。

除了像優(yōu)必選、波士頓動力、傅里葉智能這類以做本體、硬件見長的老牌機器人公司和一批近期涌現(xiàn)專注機器人產(chǎn)業(yè)的初創(chuàng)公司,比如智元機器人、銀河通用機器人、星動紀元、逐際動力等之外,還有兩派玩家。

其一是以科大訊飛、百度、騰訊、谷歌等為代表的科技大廠攜帶著感知認知的算法優(yōu)勢而來;其二則是以小鵬汽車、小米、追覓、特斯拉這類為代表的跨界廠商,這類玩家往往擁有比較確定的應用場景,以及可以共享的產(chǎn)業(yè)鏈。

三是資本對具身智能賽道的熱情,畢竟真金白銀投出去是為了有更多的回報。

據(jù)不完全統(tǒng)計,2023年國內(nèi)有9家人形機器人企業(yè)獲得累計超19億元融資,今年上半年,國內(nèi)有13家人形機器人企業(yè)融資總金額超25億元,成立僅一年的銀河通用機器人,在 6 月甚至獲得超7億人民幣天使輪融資,估值達到數(shù)十億人民幣,被稱為“年度最大天使輪”。

而以“先進制造-機器人”為標簽,截至今年8月初,則發(fā)生了135筆融資。

02 機器人的手和腳,人類都還沒“想”好

雖然行業(yè)很熱鬧,但是在研發(fā)和應用層面,人形機器人還是有諸多問題待解。

首當其沖的就是技術路線的收斂。

北航機器人研究所名譽所長,中關村智友研究院院長王田苗在“2024世界機器人大會”期間發(fā)表觀點時就表示,“當前人形機器人還面臨兩大難點,一是機器人目前的‘軟’件端,適合機器人的通用大模型和垂直專業(yè)模型,還在攻堅階段;此外,靈巧手目前在技術和成本上都有需要攻克的難點。”

所謂的“軟件“,指的是將復雜任務拆分為無數(shù)個子任務,各種子任務在現(xiàn)實的物理空間中相融合,其中就需要大模型技術的賦能,從而實現(xiàn)人機交互。

通俗的說,就是要讓機器人擁有泛化能力,比如,家庭服務機器人,不用主人發(fā)號指令,就能主動安排自己的工作,將房屋清掃、做飯炒菜、物品收納等家務能夠按照輕重緩急的順序逐一完成。

行業(yè)普遍認為,人形機器人在硬件上不存在壁壘,雖然目前不同廠商之間機器人在移動速度、負載能力等機械性能上存在不小的差距,但是這些差距并非不可逾越,時間和成本最終會抹平一切。

最終決定人形機器人能力高低的還是以軟件為基礎的泛化能力,只有擁有強大的泛化能力,人形機器人才能適應各種任務場景,才具備真正的“可用性“。

由機器人的泛化能力進行延伸,機器人的本體形態(tài),末端執(zhí)行器的選擇,也就是人形機器人的腳和手的技術方向,行業(yè)的技術路線尚未有比較統(tǒng)一的共識。

關于機器人的移動能力,行業(yè)的主要分歧為雙足和非雙足的區(qū)分。

如果執(zhí)著于具身智能所強調(diào)的“人形“,雙足是不二之選,可是在當前的技術條件下,雙足機器人的實用性、穩(wěn)定性和開發(fā)成本等方面都要弱于輪式底盤為主的非雙足方案。

兩種方案都有各自的簇擁,前者認為,就像L4級自動駕駛一樣,雙足就是人形機器人的最終形態(tài),從長遠來看,雙足的算法研究意義重大;后者認為,從商業(yè)化落地的視角來看,非雙足方案的適用性更強,也符合“沿途下蛋“的思維。

相于腳的選擇,手指方案的選擇就更多了。

有的企業(yè)選擇“一步到位“,對照著人類在機器人身上也安上了五根手指,如戴盟機器人的 Sparky 1 配備基于光學觸覺傳感器的五指靈巧手。

有的企業(yè)則先從二指夾爪、三指手出發(fā),如星塵智能S1的雙機械臂搭配二指夾爪,銀河通用G1采用右夾爪和左吸盤組合,以及 UniX AI 家庭場景機器人 Wanda 的三指手。

技術路線之所以會出現(xiàn)百花齊放的現(xiàn)象,很大一個原因就是在沒有形成統(tǒng)一標準之前,廠商們都想自己來定義這項技術。

事實上,相比手和腳的選擇,更讓人形機器人廠商們頭疼的是數(shù)據(jù)的收集問題。

提升機器人的“軟件”泛化能力,是需要訓練數(shù)據(jù)的。

自動駕駛采集數(shù)據(jù),只需在測試車輛上安裝傳感器就好了,機器人的訓練數(shù)據(jù),更多要采集人類的行為數(shù)據(jù),這也是說,需要在從事具體工作的人類身上或者工作場景中安裝傳感器,當需要人類參與到數(shù)據(jù)收集時,這個事情就變得復雜了。

智元機器人公布了公司的數(shù)據(jù)采集計劃,預計9月底建成一個有100臺左右機器人的采樣廠,對應150個工人,其目標是一個工人生產(chǎn)1000條數(shù)據(jù)/天,將數(shù)據(jù)采集的效率如何放在一旁先不談,這種數(shù)據(jù)采集的模式是否可行,還有待后續(xù)觀察。

03 人形機器人如何賺錢?

一個值得關注的細節(jié),目前很多人形機器人企業(yè)已經(jīng)進入到小批量量產(chǎn)階段,部分產(chǎn)品的價格也被廠商們打到了10萬以內(nèi)。

例如,宇樹科技G1人形機器人自5月發(fā)布以來,9.9萬元定價引發(fā)熱議。在2024世界機器人大會上,宇樹科技宣布G1迎來量產(chǎn)版,設計更適應大規(guī)模生產(chǎn)。

智元機器人合伙人兼營銷服副總裁姜青松在接受媒體采訪時表示,智元雙足人形機器人今年10月份開始量產(chǎn),后期預計一個月生產(chǎn)100臺,今年預計出貨量200臺左右,輪式機器人預計出貨100臺左右。

此外,EX機器人CEO李博陽向媒體透露,公司已實現(xiàn)量產(chǎn)盈利,今年內(nèi)會有500臺左右的生產(chǎn)數(shù)量,明年的出貨量將進一步增加。

特斯拉方面也透露,明年將小批量生產(chǎn)人形機器人,計劃在工廠部署超千臺以輔助工作。

好消息很多,可是人形機器人距離真正的商業(yè)落地還是很遠。

王田苗表示,現(xiàn)階段無論15萬還是10萬或更便宜,主要還是面向科研平臺展示,類似于自動駕駛行業(yè)中的線控底盤,目前的人形機器人產(chǎn)品更多是行業(yè)內(nèi)的內(nèi)部消化,同行們買來進行相關研發(fā)來用。

有行業(yè)人士分析表示,對應著自動駕駛的商業(yè)機會,具身智能,也就是人形機器人的發(fā)展過程中也有著三類機遇。

首先是像L4級自動駕駛一樣,機器人本地的開發(fā),瞄準人形機器人的終局提前占位,只要能夠熬到具身智能時代的真正到來,自然能夠爽吃一把。

其次是像自動駕駛在礦山、封閉園區(qū)、環(huán)衛(wèi)清掃這樣的特定場景中的應用,人形機器人的場景開發(fā)也有不少機會,只是現(xiàn)在階段行業(yè)的探索尚未有明確的結(jié)果。

最后是上下游的產(chǎn)業(yè)機會,有時候賣鏟子遠比挖礦更賺錢。這里的上游包括智算中心的建設、算力芯片和端側(cè)模型等方面的關鍵技術;下游則涉及到各種傳感器、關節(jié)模組等,類似于自動駕駛中的各種雷達、智能座艙等。

對照著以上,人形機器人產(chǎn)業(yè)的發(fā)展路徑其實已經(jīng)非常清晰了。

雖然目前行業(yè)對于人形機器人在智能機器人領域的占比有不同觀點,樂觀派認為人形機器人的市場份額最高將超過60%。

另一部分產(chǎn)業(yè)觀察者則認為,人形機器人只解決了一部分需求,而其他類型的機器人,如臂式、輪式、履帶式等機器人的適用場景更加豐富,因而人形機器人只會占據(jù)30%左右的市場份額。

真正的市場競爭與坐在辦公室里的“兵棋推演”還是會有不同,人形機器人的具體形態(tài)取決于應用場景和客戶需求,取決于客戶愿意為哪種服務成本和產(chǎn)品功能買單,最終還是要看技術的創(chuàng)新能力和發(fā)展程度。

來自國際機器人協(xié)會預測顯示,2021年至2030年,全球人形機器人市場規(guī)模年復合增長率將高達71%。中國電子學會數(shù)據(jù)則稱,到2030年,我國人形機器人市場規(guī)模有望達到約8700億元。

       原文標題 : 具身智能火了,但規(guī)模落地還需時間

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號