華為重磅！

kumusi 2024-06-23 發(fā)布于安徽

展開全文

中國基金報記者馮堯

為期3天（6月21日至23日）的“華為開發(fā)者大會2024”，給業(yè)界帶來了不少驚喜：被稱為“純血鴻蒙”的鴻蒙NEXT面世、“夸父”人形機(jī)器人亮相、盤古大模型5.0發(fā)布……其中，鴻蒙NEXT恐怕是迄今為止最“聰明”的鴻蒙系統(tǒng)，其最為重要的三大特點(diǎn)之一，便是原生智能能力。華為提出了“鴻蒙原生智能”概念，背后仰仗著大模型的支撐。“夸父”的橫空出世，展示了識別物品、問答互動、擊掌、遞水等能力，這同樣離不開盤古具身智能大模型的加持。盤古具身智能大模型提升了機(jī)器人的智能及泛化能力。

而盤古大模型則在一年內(nèi)從3.0版本進(jìn)化為5.0版本，帶來了全系列、多模態(tài)的變化。其參數(shù)覆蓋面從十億級到萬億級，而多模態(tài)能力令盤古大模型能夠更精準(zhǔn)地理解世界。

所有的蛻變都離不開人工智能。記者在此次一線實探中，深切感受到人工智能帶來的科技“溫度”。毫不夸張地說，此次華為開發(fā)者大會實際上更像是一場“AI的盛宴”。AI讓一切變得更“聰明”，一切都離不開它。

但在參加此次華為開發(fā)者大會的業(yè)內(nèi)人士看來，無論AI未來如何進(jìn)化，其最終歸宿將是跨入產(chǎn)業(yè)?！氨M管國內(nèi)算力受限、也沒有算法優(yōu)勢，但國內(nèi)擁有全球最全的工業(yè)門類，行業(yè)數(shù)據(jù)最全、場景最多，行業(yè)大模型大有可為”，業(yè)內(nèi)人士如是表述。

“小藝”為何變聰明了？

在華為開發(fā)者大會的鴻蒙展示區(qū)域內(nèi)，工作人員向記者展示了鴻蒙NEXT的原生智能能力，即用各類圖片對“小藝”進(jìn)行“投喂”。

例如，在識別人們并不熟悉的旅游景點(diǎn)建筑時，“小藝”在識別后會明確給出景點(diǎn)的詳細(xì)資料，同時會附上相應(yīng)的旅游攻略，供用戶參考。

再如，當(dāng)“小藝”識別人物照片時，甚至可以知悉人物著裝的品牌，包括衣物、背包、鞋類等，同時“小藝”可以幫助用戶識別衣物等物品所對應(yīng)的商店、網(wǎng)店，更便于用戶購物。

而當(dāng)用戶搜尋文檔時，“小藝”甚至可以根據(jù)要求，提取其中重要內(nèi)容并生成PPT，供用戶使用。也就是說，只需將文字、圖片、文檔“投喂”給小藝，其即可便捷高效處理文字、識別圖像、分析文檔。

這依賴于鴻蒙NEXT與AI的融合升級，華為也提出了“鴻蒙原生智能”概念。

實際上，就在不久前的蘋果全球開發(fā)者大會上，蘋果就發(fā)布了其自研的Apple Intelligence（蘋果智能），并宣布其Siri語音助手將接入GPT-4o，構(gòu)成iOS AI的智能體體系。

而華為也將操作系統(tǒng)層的鴻蒙和模型層的盤古聯(lián)合起來，共同構(gòu)建系統(tǒng)級原生智能，這在國內(nèi)尚屬首次。盤古上身 “夸父”出道另一邊，在華為云的展示區(qū)中，人工智能的氛圍更為濃厚。其中，人形機(jī)器人“夸父”身邊聚集了眾多參會者。

在6月21日的發(fā)布會上，“夸父”現(xiàn)場演示了復(fù)雜任務(wù)執(zhí)行，包括與華為常務(wù)董事、華為云CEO張平安擊掌，分辨位于它面前的與華為有關(guān)的物品，并在得知主持人口渴時，將面前桌上的水遞給了主持人。

而在展示區(qū)內(nèi)，“夸父”與參會者近距離接觸。在展示現(xiàn)場區(qū)內(nèi)，這款機(jī)器人通過理解工作人員的食物喜好，來搭配食材，并烹飪美食，同時展示了行動能力。

實際上，“夸父”并非新產(chǎn)物，其為樂聚公司推出的人形機(jī)器人。而樂聚是一家老牌人形機(jī)器人公司，創(chuàng)立于2016年3月，總部位于深圳。

資料顯示，“夸父”發(fā)布于2023年12月，重約45kg，全身26個自由度，行走速度最高可達(dá)4.6km/h，可快速連續(xù)跳躍，跳躍高度超20cm。其搭載自研一體化關(guān)節(jié)和深度攝像頭，可實現(xiàn)全方位視覺感知。

真正令“夸父”實現(xiàn)進(jìn)化的是人工智能。據(jù)工作人員介紹，盤古具身智能大模型令“夸父”的智能及泛化能力得以提升。

該模型具備多模態(tài)（文本、圖像、視頻）能力，使機(jī)器人能夠模擬人類常識進(jìn)行邏輯推理，能夠讓機(jī)器人完成10步以上的復(fù)雜任務(wù)規(guī)劃，并且在任務(wù)執(zhí)行中實現(xiàn)多場景泛化和多任務(wù)處理。同時，盤古大模型還能生成機(jī)器人需要的訓(xùn)練視頻，讓機(jī)器人更快地學(xué)習(xí)各種復(fù)雜場景。

張平安展望了一個未來場景：AI機(jī)器人將幫助人們處理日常家務(wù)，如洗衣、做飯和掃地，從而讓人們有更多時間投身于閱讀、創(chuàng)作等更有意義的活動。

其實，人形機(jī)器人與大模型的結(jié)合是大勢所趨。今年年初，英偉達(dá)展示了多模態(tài)人形機(jī)器人通用基礎(chǔ)模型GR00T，其可作為機(jī)器人的大腦，驅(qū)動機(jī)器人理解自然語言，通過觀察人類行為來快速學(xué)習(xí)協(xié)調(diào)、靈活性和其他技能。

而OpenAI與人形機(jī)器人獨(dú)角獸公司Figure合作推出的Figure 01機(jī)器人，依托OpenAI的大模型，能僅利用獨(dú)立神經(jīng)網(wǎng)絡(luò)，接收人類指令，并執(zhí)行向人類傳遞蘋果、整理垃圾、放置餐具的動作。馬斯克近期也在特斯拉2024年股東大會上表示，特斯拉的人形機(jī)器人將采用大語言模型。

“大模型人形機(jī)器人”蔚然成風(fēng)。盤古大模型的進(jìn)化其實不難看出，無論是鴻蒙NEXT系統(tǒng)還是人形機(jī)器人“夸父”，令其更為“聰明”的底座均為盤古大模型。而盤古大模型此次也迎來歷史性的進(jìn)化：從一年前的3.0版本，升級成為5.0版本。

盤古大模型5.0在全系列、多模態(tài)、強(qiáng)思維三個方面實現(xiàn)全新升級。

其中在全系列方面，其覆蓋了十億級到萬億級參數(shù)，從手機(jī)到企業(yè)云實現(xiàn)全覆蓋。而多模態(tài)方面的升級，令盤古大模型5.0支持10K超圖像識別，能夠更好更精準(zhǔn)地理解物理世界，包括文本、圖片、視頻、雷達(dá)、紅外、遙感等更多模態(tài)。

例如，當(dāng)被問到“《清明上河圖》中趙太丞家有多少人”，盤古大模型5.0可以在占全圖1/200的畫面中，識別出細(xì)小畫面和漢字，并得出“4個人”這一正確答案。

但實際上，相較于盤古大模型“炫技”而言，更具有現(xiàn)實意義的是，盤古大模型已經(jīng)開始扎根于各行各業(yè)。

在華為云的展示區(qū)內(nèi)，更多的舞臺留給了盤古大模型在各大專業(yè)化產(chǎn)業(yè)領(lǐng)域的融合，例如工業(yè)制造、生物醫(yī)藥、氣象服務(wù)等。

而且，華為云在此次大會上一口氣發(fā)布了六個專業(yè)模型：盤古鋼鐵大模型、盤古高鐵大模型、盤古具身智能大模型、盤古工業(yè)設(shè)計大模型、盤古安全大模型及盤古媒體大模型。

工作人員告訴記者，例如在高鐵行業(yè)，基于盤古高鐵大模型，華為云為高鐵檢測裝上了“盤古眼”，幫巡檢工人減少了龐大工作量?！耙涣袆榆嚨?.2萬個故障檢測項點(diǎn)，本來需要4人花費(fèi)2小時進(jìn)行檢查，而用盤古大模型，自動識別準(zhǔn)確率可達(dá)99%?！?/p>

模型本身只是一張“白紙”

“當(dāng)前，國內(nèi)的大模型充滿挑戰(zhàn)，例如算力受限、沒有算法優(yōu)勢等?！币晃慌c會的業(yè)內(nèi)人士對記者表示。

實際上，從GPT-3的1750億參數(shù)規(guī)模，到GPT-4非官方估計1.8萬億參數(shù)，GPT-5參數(shù)量或?qū)⑼黄?0萬億，OpenAI、Google等均沿著這條路徑一路前行。

“如果參數(shù)無限向上，大模型最終是否能夠通往通用人工智能，目前沒有人能夠得到確切答案?！?他表示，從當(dāng)前現(xiàn)實情況來看，一個通用的大模型，盡管可能擁有千億級別的參數(shù)，幾乎可以回答任何問題，但是在專業(yè)領(lǐng)域的表現(xiàn)可能只是普通甚至難以勝任。

再加上隨著模型規(guī)模不斷增大帶來的模型幻覺、居高不下的訓(xùn)練成本以及算力資源的稀缺等挑戰(zhàn)，都成為擺在業(yè)內(nèi)的現(xiàn)實問題。

“不止國內(nèi)需要面對算力資源的稀缺問題，全球都會面對這一問題。所以，把有限的算力用好，汲取硬件資源提供的每一分能力，成為業(yè)內(nèi)首要考慮的問題，這也是突破算力瓶頸的必然之路?！币晃蝗A為云人士表示。

“模型本身只是一張'白紙’，上面畫出什么樣的一幅'畫’，由數(shù)據(jù)決定，需要高質(zhì)量數(shù)據(jù)。”他如是表述，“國內(nèi)擁有全球最全的工業(yè)門類，行業(yè)數(shù)據(jù)最全、場景最多?！?/p>

在多位受訪人士看來，大模型的發(fā)展將趨向通用化與專用化并行，企業(yè)對于大模型的需求不僅僅是實現(xiàn)通識，更需要其成為特定領(lǐng)域的“最強(qiáng)大腦”。面向行業(yè)解決特定問題的專屬大模型，將加速企業(yè)數(shù)據(jù)價值的釋放、提高數(shù)據(jù)和知識的利用率。

根據(jù)IDC相關(guān)調(diào)研顯示，目前有60%的企業(yè)使用大模型的公開版本，但兩年后會迅速降至17%，更多的企業(yè)會將AI應(yīng)用建立在私有、專屬模型基礎(chǔ)上。

“行業(yè)市場需要更豐富的、更多種類的行業(yè)大模型應(yīng)用到具體場景里去產(chǎn)生價值，而不只是一個大模型無限泛化能力去解決所有問題?！鄙鲜鋈A為云人士表示，“大模型只有融入企業(yè)運(yùn)營、緊貼應(yīng)用場景，才能真正發(fā)揮帶動產(chǎn)業(yè)升級的作用?！?/p>

編輯：小茉

審核：許聞

本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點(diǎn)擊一鍵舉報。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自： kumusi > 《科技》

舉報/認(rèn)領(lǐng)