天天躁日日躁狠狠躁一级毛片,欧美精品一区二区三区中文,欧美成人精品三级在线看

意料之外的AI硬件巨頭

2023-05-04 16:15

詩與星空

關(guān)注

文：詩與星空(ID: SingingUnderStars)

很多年前，曾經(jīng)很流行一種網(wǎng)絡(luò)游戲，叫MUD（也叫玩泥巴，現(xiàn)在依然有很多MUD服務(wù)器，但玩家大多是上古遺留人士）。

這種游戲沒有圖形界面，人機(jī)交互靠的是文本，早期還都是英文，后來支持漢字。

比如，到了一個地方，輸入look，系統(tǒng)會告訴你，這是哪里，有什么，然后嗖對方一箭射過來，你就昏迷了過去。

最近一直高強(qiáng)度使用ChatGPT、Claude、文心一言等生成式通用人工智能，突然想到一件事：如果把這些AI工具，接入硬件設(shè)備會怎樣？

還真有人在這么干，一個是微軟，一個是谷歌。

微軟畫得大餅

2月20日，微軟發(fā)布了"ChatGPT for Robotics"的技術(shù)報(bào)告，為如何將ChatGPT 融入機(jī)器人領(lǐng)域提供了一種可能的視角。

與純文本的應(yīng)用不同，機(jī)器人系統(tǒng)需要對現(xiàn)實(shí)世界的物理、環(huán)境背景和物理動作的執(zhí)行能力有深入的了解。

而且所生成機(jī)器人模型需要具備相當(dāng)?shù)某ＷR性知識和符合實(shí)際的物理模型，以及與用戶交互以解釋和執(zhí)行實(shí)際現(xiàn)實(shí)中可行的命令。

從報(bào)告來看，非常像玩MUD。

1.首先需要手工設(shè)計(jì)一系列的機(jī)器人功能庫函數(shù)來實(shí)現(xiàn)底層執(zhí)行器的命令，如，移動，停止，獲得目標(biāo)的位置信息等等。

2.第二步是給ChatGPT 寫一個提示詞，用來描述需要讓ChatGPT 執(zhí)行的目標(biāo)。

3.第三步是使用者評估ChatGPT 生成的代碼，并且給ChatGPT 提供反饋，讓ChatGPT 進(jìn)行下一步改進(jìn)。

4.通過提供反饋，將代碼進(jìn)行不斷迭代改進(jìn)，當(dāng)測試通過之后，就可以部署到實(shí)際的系統(tǒng)中了。

經(jīng)過對ChatGPT特定訓(xùn)練后（其實(shí)是一種lora），形成穩(wěn)定的版本，ChatGPT在理解了“自然語言”后，把指令分解通知機(jī)器人，然后調(diào)取其傳感器，根據(jù)反饋結(jié)果進(jìn)行下一步處理。

在ChatGPT出現(xiàn)之前，人和機(jī)器人（其他設(shè)備類似）交互是一種非常專業(yè)的事情，一般由設(shè)備廠件提供標(biāo)準(zhǔn)的交互軟件，如果可以定制，再給一個可以調(diào)用的SDK，所有操作幾乎都是提前寫死的，幾乎做不到全自動的運(yùn)動。

像大疆能夠做到自主反饋，已經(jīng)是機(jī)械設(shè)備領(lǐng)域的巔峰了。

AI改變了這一切。

谷歌做的樣機(jī)

3月10日左右，谷歌發(fā)布了一段視頻，基于一個名叫PaLM-E的大模型。

通過這個大模型的驅(qū)動，機(jī)器人可以按照人類的指令去拿零食、拿可樂。

如果說微軟的技術(shù)報(bào)告還在PPT階段的話，谷歌已經(jīng)實(shí)現(xiàn)了工程樣機(jī)。

現(xiàn)在回過頭來再思考當(dāng)年谷歌為什么收購波士頓動力，似乎恍然大悟。

可惜的是，在大模型方面谷歌沒能第一時間領(lǐng)先，波士頓動力也因成本過高出手。

比如給它一張圖片，然后讓它根據(jù)所看到的做出蛋糕。

模型能先判斷出圖像中都有什么，然后分成9步講了該如何制作蛋糕，從最初的磕雞蛋到最后洗碗都包括在內(nèi)。

大模型從NLP到CV

ChatGPT也好，文心一言也好，現(xiàn)在大模型的應(yīng)用主要用在NLP（自然語言處理）領(lǐng)域，實(shí)際應(yīng)用以交互對話為主。

而機(jī)器人的領(lǐng)域，是CV（機(jī)器視覺），這個領(lǐng)域的人工智能最領(lǐng)先的國家是誰？

中國。

2022 年，CVPR 大會的投稿量達(dá)到 8161 份，相比 2021 年度的 7093 份提交增長了 15%。其中 44.59% 的作者來自中國，排在第二名的是美國，占據(jù) 20.65%。

同濟(jì)研二在讀，達(dá)摩院研究型實(shí)習(xí)生獲得了最佳學(xué)生論文獎。

同濟(jì)、清華、阿里達(dá)摩院等學(xué)術(shù)機(jī)構(gòu)大獎拿到手軟，很多國內(nèi)企業(yè)也大放異彩，比如商湯有 66 篇論文入選，還拿到了 CVPR 2021 ActivityNet 時序動作檢測任務(wù)弱監(jiān)督學(xué)習(xí)賽道冠軍以及 CVPR 2021 NTIRE 視頻理解挑戰(zhàn)賽的三項(xiàng)冠軍；快手也有 14 篇論文被接收，涵蓋三維視覺、目標(biāo)檢測、視頻目標(biāo)分割、人臉偽造技術(shù)檢測等熱門研究領(lǐng)域

換言之，ChatGPT嘴皮子功夫再厲害，最終還是要喂給機(jī)器，這才是真正的生產(chǎn)力。

到了這個環(huán)節(jié)，就是中國人的天下了。所以完全不用擔(dān)心AI領(lǐng)域中國會落后。

軟件的本質(zhì)是算法，算法的本質(zhì)是數(shù)學(xué)。

數(shù)學(xué)？嘿嘿嘿。中國人的數(shù)學(xué)已經(jīng)卷出地球了。