硬核!“華為天才少年”讓自己組裝一臺(tái)家用機(jī)器人不是夢(mèng)!
如果說宇樹機(jī)器人向我們展示了新一代機(jī)器人在工業(yè)、娛樂等方面的潛力,那么由“華為天才少年” 彭志輝創(chuàng)立的智元機(jī)器人則在昨天開啟了機(jī)器人在家用領(lǐng)域的應(yīng)用大門。
沒有跳舞、武術(shù)、翻越障礙等花哨的動(dòng)作,智元機(jī)器人靈犀X2展示的僅僅只是騎車、縫葡萄、看書、聊天等我們?nèi)粘I钪?span id="nphyl0b" class="mgc">最普通的情形,但是我們知道,這些最普通的情形,才是機(jī)器人產(chǎn)業(yè)最大的難點(diǎn)——在電力的驅(qū)動(dòng)下,想要化身大力士不難,只要一個(gè)千斤頂即可,但要模仿人類的日常動(dòng)作,卻涉及人工智能、機(jī)械、電子、影像等方方面面的技術(shù)。
在擁有這些人類的基礎(chǔ)能力后,讓靈犀X2g更像一個(gè)人了!所以彭志輝表示:“我們希望機(jī)器人的生產(chǎn)力價(jià)值能夠外溢到日常生活,讓機(jī)器人成為‘吉祥三寶’,也就是保安、保姆和保潔。”
那么,智元機(jī)器人如何做到讓旗下產(chǎn)品初具家用機(jī)器人的雛形呢?
硬件為基:可以像組裝電腦一樣組裝機(jī)器人
總體來看,智元機(jī)器人靈犀X2全身共28個(gè)自由度、體重33.8千克,采用了一套基于Diffusion的生成式動(dòng)作引擎,基于VLM的硅光動(dòng)語多模態(tài)模型。其中,在硬件方面,靈犀X2共有三大創(chuàng)新!
像組裝電腦一樣組裝機(jī)器人:
靈犀 X2在硬件設(shè)計(jì)中,將靈犀 X2硬件系統(tǒng)抽象為一系列可復(fù)用的核心組件,核心組件包括:小腦控制控制器 Xyber-Edge,域控制器 Xyber-DCU,智能電源管理系統(tǒng) Xyber-MS 以及迭代了多版本的核心關(guān)節(jié)模組 Powerflow 等等。
通過這些可拆分、復(fù)用組件,智元能夠像組裝臺(tái)式電腦一樣,快速搭建起一套靈活、完整、可靠的人形機(jī)器人系統(tǒng)。
大量使用柔性材料:
在機(jī)體的材料選擇上,智元使用了非常親和的柔性材料。這使得靈犀 X2 的皮膚柔軟有彈性,這一方面能夠保證運(yùn)動(dòng)時(shí)的柔韌性,另一方面也對(duì)人類接觸友善。
全新的關(guān)節(jié)設(shè)計(jì):
靈犀 X2 的機(jī)電關(guān)節(jié)模組重新設(shè)計(jì),在 X2 原型機(jī)全身 28 個(gè)自由度中,沒有使用到任何一個(gè)并聯(lián)結(jié)構(gòu),既能夠保證慣量上移,又實(shí)現(xiàn)了傳動(dòng)鏈的完全解構(gòu)。這意味著任一關(guān)節(jié)的活動(dòng),都是獨(dú)立驅(qū)動(dòng),避免并聯(lián)結(jié)構(gòu)中多鏈條驅(qū)動(dòng)帶來的相互約束問題,降低了肢體末端的慣性,保證動(dòng)作更靈敏精確。
軟件為“心”:讓機(jī)器人自身具有學(xué)習(xí)和交流能力
要讓一臺(tái)機(jī)器人像人,只有硬件創(chuàng)新是不夠的,這只能讓它在外形上像人。還必須搭配算法和大模型技術(shù),才能夠讓機(jī)器人在行為動(dòng)作上,也像一個(gè)人!
相比于傳統(tǒng)的機(jī)器人,人類最大的特點(diǎn)是具有自主學(xué)習(xí)能力,而靈犀X2在這方面邁出了關(guān)鍵一步,該機(jī)器人同樣具有自主學(xué)習(xí)能力。
3月10日,智元機(jī)器人還發(fā)布了首個(gè)通用具身基座模型——智元啟元大模型,它開創(chuàng)性地提出了Vision-Language-Latent-Action (ViLLA) 架構(gòu),該架構(gòu)由VLM(多模態(tài)大模型)+ MoE(混合專家)組成,可以利用人類視頻學(xué)習(xí),完成小樣本快速泛化,降低了具身智能門檻,并成功部署到智元多款機(jī)器人本體,持續(xù)進(jìn)化。
目前,靈犀X2目前初步具備了簡單任務(wù)中對(duì)操作物體的零樣本泛化能力,比如給葡萄“縫合傷口”等精細(xì)活也不在話下。
當(dāng)然,作為一款可能家用的機(jī)器人,靈犀X2還必須具有與人類交互的能力。
在人機(jī)交互方面,靈犀X2搭載多模態(tài)交互大模型“硅光動(dòng)語”,并通過邊緣側(cè)“端到端”模型架構(gòu)的工程優(yōu)化,使其具備毫秒級(jí)的交互反應(yīng)能力,使其能夠通過人類的面部表情和語音語調(diào)精準(zhǔn)判斷情感狀態(tài),并做出相應(yīng)的回應(yīng)。靈犀X2還能模擬人類的好奇心和注意力機(jī)制,有“偷看”“撓癢”等擬人化的表現(xiàn)。
彭志輝表示,硅光動(dòng)語中的“光”代表視覺,“動(dòng)”代表動(dòng)作,“語”代表語音,因此也是第一臺(tái)真正具備復(fù)雜交互能力的“靈動(dòng)機(jī)器人”。目前該公司還在完善這款機(jī)器人的思維模型。
在這些技術(shù)的加持下,在彭志輝發(fā)布的視頻中,彭志輝已經(jīng)能和靈犀X2展開正常聊天了。在問題和答案并未預(yù)設(shè)的前提下,機(jī)器人對(duì)彭志輝提出的問題一一作答,比如:
如果我的狗和你掉進(jìn)水里,我先救誰?
如果給你看《銀翼殺手》你會(huì)不會(huì)哭到短路?
靈犀X2 回答的是「先救狗狗我沒事」,「不會(huì)哭但會(huì)感慨萬千」。這類語言表述自然,兼具「理性」與「感性」,甚至在回答的時(shí)候,它還會(huì)有手部動(dòng)作向你互動(dòng)。
相關(guān)閱讀
- 英思特續(xù)聘范立忠為董秘:2024年薪酬100萬 公司上市7個(gè)月市值減少19.85億
- 金嶺礦業(yè):2025年上半年凈利預(yù)增66%至112% 戰(zhàn)略轉(zhuǎn)型成效顯現(xiàn)
- 邁普醫(yī)學(xué)任命朱彥聰為副總經(jīng)理:其簡歷存在歧義 在上家單位的職務(wù)或不準(zhǔn)確
- 金道科技續(xù)聘天健為2025年審計(jì)機(jī)構(gòu):項(xiàng)目質(zhì)量復(fù)核人員吳慧今年1月被出具警示函
- 三友醫(yī)療續(xù)聘DavidFan為董秘:2024年薪酬90萬 公司上市5年多市值減少20.32億
- 玲瓏輪胎續(xù)聘孫松濤為董秘:2024年薪酬97萬 今年一季度公司凈利減少23%
- 熱景生物續(xù)聘石永沾為董秘:2024年薪酬55萬 今年一季度公司虧損2401萬
- 萬和電氣續(xù)聘盧宇凡為董秘:2024年薪酬100萬 年度股東會(huì)關(guān)聯(lián)交易與高管薪酬議案遭否
- 浩洋股份續(xù)聘勞杰偉為董秘:2024薪酬119萬 公司上市5年市值減少21.49億
- 夢(mèng)網(wǎng)科技續(xù)聘馬立為董秘:任內(nèi)公司市值增加49.62億 今年一季度公司凈利減少58%
推薦閱讀
快訊 更多
- 04-10 11:21 | 為“首發(fā)經(jīng)濟(jì)”注入創(chuàng)新動(dòng)力,CMEF見證寬騰醫(yī)學(xué)影像技術(shù)革新
- 02-20 18:53 | 手機(jī)也要上HBM芯片?三星計(jì)劃推出移動(dòng)版HBM,預(yù)計(jì)首款產(chǎn)品2028年上市
- 12-30 16:40 | 國產(chǎn)首款DDR5內(nèi)存問世!價(jià)格戰(zhàn)開啟,復(fù)制長江存儲(chǔ)擊敗三星路徑!
- 12-30 16:36 | 華為手機(jī)回歸第一年:全年銷量或超4000萬臺(tái) 有望憑借Mate 70在高端市場(chǎng)擊敗蘋果
- 11-26 18:19 | 眾興菌業(yè)擬與漣水縣人民政府簽訂《招商引資合同書》 擬投資設(shè)立漣水食用菌產(chǎn)業(yè)園項(xiàng)目
- 11-26 18:16 | 美芝股份中選vivo全球AI研發(fā)中心-精裝工程采購項(xiàng)目(標(biāo)段二)
- 11-26 18:14 | 健之佳擬用不超1億回購公司股份 維護(hù)公司價(jià)值及股東權(quán)益
- 11-26 09:53 | 格靈深瞳收購深圳市國科億道科技有限公司部分股權(quán)并增資5000萬
- 11-26 09:37 | 煒岡科技擬以1.49億購買衡所華威9.33%股權(quán) 華海誠科擬發(fā)行可轉(zhuǎn)債收購煒岡科技所持衡所華威股權(quán)
- 11-25 10:41 | 精工科技與眾億匯鑫簽署5.16億元銷售合同