王興興:機器人最大的問題仍是AI模型?大模型怎樣不行用了? |
發(fā)布時間:2025-09-14 文章來源:本站 瀏覽次數(shù):26 |
王興興(宇樹科技創(chuàng)始人兼CEO)認為,當前機器人領(lǐng)域的核心瓶頸并非硬件,而是AI模型的能力,特別是大模型在理解物理世界、多模態(tài)融合和實際任務執(zhí)行方面還存在明顯不足。這些年,伴跟著人工智能和機器人的高速開展,AI驅(qū)動現(xiàn)已成為了大多數(shù)人的一致,但是就近知名機器人公司宇樹科技的創(chuàng)始人王興興卻表明當時機器人大的問題仍是AI模型,這究竟是怎樣回事?為啥如此蓬勃開展的大模型不行用了? 一、王興興:機器人大的問題仍是AI模型? 據(jù)洶涌新聞的報道,在2025外灘大會圓桌討論環(huán)節(jié),宇樹科技創(chuàng)始人兼首席執(zhí)行官王興興表明,在機器人范疇,硬件和大腦不是同一層面的事,現(xiàn)階段,機器人硬件徹底足夠用,“用一兩年都可以”,大的問題仍是AI大模型自身才能不行用,在多模態(tài)交融方面體現(xiàn)還不行理想。 王興興表明,目前純言語模型或純視頻模型的作用現(xiàn)已十分好,但如果要把言語和圖畫很好地結(jié)合起來,仍是一個較大的難點。在機器人范疇,現(xiàn)階段沒有很好的方法把硬件用起來。比方怎么用模型控制機器人靈巧手等,目前還存在必定應戰(zhàn)。他表明,盡管AI在信息處理、文字圖畫等范疇,AI使用的體現(xiàn)現(xiàn)已十分好,但讓AI干活的范疇仍是荒漠,僅僅長了幾棵小草,爆發(fā)性增長的前夜還未到來。 “現(xiàn)在是對年輕人十分友愛的時代,AI時代是一個十分公正的時代”,王興興以為,年輕人可以用AI模型自己學編程等。他鼓舞大家可以對AI模型的認知更急進一些,可以不只僅把AI僅僅當作一個東西,還可以把它當作一個全能型的東西,去重新學習和接受它,把它用得更好。 不過和王興興有類似看法的人其實并不少,網(wǎng)上曾經(jīng)流傳著一個段子“我想AI應該是幫我做洗衣和洗碗的活兒,好讓我去玩藝術(shù)、搞創(chuàng)作;而不是AI去玩藝術(shù)搞創(chuàng)作讓我來做洗衣洗碗的活兒”。 二、大模型是怎樣不行用的? 跟著人工智能技術(shù)的迅猛開展,機器人現(xiàn)已成為現(xiàn)代科技的重要組成部分。但是,盡管大模型的開展速度飛快,但其在實踐使用中的體現(xiàn)卻仍不盡善盡美,尤其是在機器人賽道,這就是王興興表態(tài)的根源,咱們該怎樣看這件事呢? 首要,大模型雖開展迅猛,但大多仍處于開展的初級階段。近年來,大模型范疇可謂是如火如荼,許多科技巨子和科研團隊紛紛投入許多資源進行研發(fā)。從前期的簡略模型到如今參數(shù)規(guī)劃龐大、功用日益雜亂的大模型,其開展速度可謂令人嘆為觀止。但是,咱們必須清醒地認識到,目前大部分大模型依然停留在邏輯推理的層面。它們可以依據(jù)輸入的信息進行必定程度的邏輯剖析和推理,輸出看似合理的成果。但這種邏輯推理更多是依據(jù)已有的數(shù)據(jù)和預設的規(guī)則,缺少實在的了解和立異才能。 以自然言語處理范疇的大模型為例,它們可以生成流通的文本,答復各種問題,但在處理一些具有深度和雜亂性的語義了解時,往往會出現(xiàn)偏差。比方,關(guān)于一些隱晦的隱喻、雙關(guān)語或許文化背景相關(guān)的表達,大模型或許無法精確掌握其實在意義。可以說,大模型在了解人類言語的豐厚內(nèi)在和奇妙之處方面還有很長的路要走。并且,大模型目前的開展依然處于初期階段,需求不斷地進行練習和優(yōu)化。每一次的練習都需求海量的數(shù)據(jù)和強壯的核算資源支撐,這不只本錢昂揚,并且練習過程也存在諸多不確定性。因而,從全體開展水平來看,大模型間隔實在老練還有很大的差距。 其次,機器人硬件盡管現(xiàn)已滿足需求,但大模型思想方法與人類差異巨大。在機器人硬件方面,近年來取得了明顯的前進。各種先進的傳感器、執(zhí)行器和機械結(jié)構(gòu)使得機器人在感知環(huán)境、運動控制等方面具有了強壯的才能。例如,一些工業(yè)機器人可以精確地完結(jié)雜亂的裝配使命,服務機器人可以在室內(nèi)環(huán)境中自主導航、避障。但是,硬件的前進并沒有徹底轉(zhuǎn)化為機器人智能水平的進步,關(guān)鍵問題在于大模型的思想方法與人類思想存在較大差異。 人類在處理問題時,往往可以憑仗直覺、經(jīng)驗和創(chuàng)造力快速做出判斷和決議計劃。一些看似簡略的工作,比方辨認一個物體的用途、了解一個場景的氛圍,關(guān)于人類來說或許是本能反響。但關(guān)于大模型來說,這些使命卻需求相當長的一段時間來進行練習。以圖畫辨認為例,盡管大模型在辨認常見物體方面現(xiàn)已取得了很高的精確率,但關(guān)于一些不常見或許具有特別意義的圖畫,大模型或許需求許多的標示數(shù)據(jù)進行練習才能精確辨認。并且,大模型在處理問題時通常是依據(jù)統(tǒng)計規(guī)則和模式匹配,缺少對事物本質(zhì)的了解。這種思想方法上的差異導致大模型在面對雜亂多變的現(xiàn)實場景時,往往體現(xiàn)出無能為力。 第三,大模型當時僅能代替基礎(chǔ)工作,高難度使命面前無能為力。從當時大模型的實踐使用來看,其可以代替和勝任的依然是許多基礎(chǔ)性、重復性、規(guī)則明確的工作使命。例如,在客服范疇,大模型可以高效處理標準化的問答;在內(nèi)容創(chuàng)作中,可以生成新聞稿、營銷文案等格式化文本;在工業(yè)自動化中,可執(zhí)行預設程序的裝配與檢測。但是,一旦使命雜亂度進步,觸及多過程推理、跨范疇常識整合或動態(tài)環(huán)境習氣,大模型的體現(xiàn)便敏捷下降。 以家庭服務機器人為例,簡略的“播放音樂”“開關(guān)燈”等語音指令可以順利完結(jié),但咱們要知道咱們?nèi)粘H兆又械脑S多場景是含糊的,比方說:幫我找找昨日收到的快遞,或許放在門口的鞋柜或許沙發(fā)底下等當?shù),這關(guān)于機器人來說就難度巨大了,機器人不只需求了解時間、物品、空間位置等多重信息,還需具有視覺查找、物體辨認、途徑規(guī)劃和交互反響等歸納才能,這對當時的大模型而言仍是巨大應戰(zhàn)。因而,咱們依然需求知道,大模型目前仍處于“東西化”階段,而非“智能體”階段,其才能邊界明晰,難以應對實在世界中普遍存在的含糊性與不確定性。 第四,具身智能離構(gòu)建符合實踐工作需求的大腦還有很長的一段路。具身智能作為人工智能的一個重要分支,旨在賦予機器人身體感知和舉動的才能,使其可以在實在環(huán)境中自主完結(jié)使命。如今,越來越多的東西化機器人涌入商場,它們可以在特定場景下完結(jié)特定的操作,比方搬運貨物、打掃地上等。 但要完成實在像人相同工作的機器人依然面對巨大困難。以做家務為例,一個合格的家庭主婦不只要知道怎么打掃房間、洗衣服做飯,還要懂得依據(jù)家庭成員的習氣和喜好來組織日常事務,甚至在遇到突發(fā)狀況時可以敏捷做出反響。這關(guān)于機器人的大模型提出了極高的要求,它需求具有全面的日子常識、情感了解和社交交流才能。 目前,盡管有些機器人現(xiàn)已學會了扭秧歌這樣的表演性動作,但這間隔實在意義上的家務勞動和助理角色還有很長的路要走。要讓機器人實在融入人類日子,成為得力的幫手,就需求為其打造一個高度發(fā)達且符合實踐工作需求的“大腦”,而這無疑需求許多的大模型練習和實踐積累。 第五,人工智能的未來究竟該向何處去?關(guān)于大模型的開展來說,目前簡略低質(zhì)量地卷參數(shù)現(xiàn)已意義不大。跟著模型參數(shù)規(guī)劃的不斷擴展,盡管在必定程度上進步了模型的性能,但也帶來了諸多問題,如練習本錢昂揚、模型推理速度慢、可解釋性差等。并且,單純尋求參數(shù)規(guī)劃的擴展并不能從根本上處理大模型在具身智能使用中面對的難題。 大模型們進化晉級該考慮的工作是怎么可以實在幫助具身智能的落地。這需求從多個方面進行努力。一方面,要優(yōu)化大模型的練習方法和算法,進步模型的練習效率和質(zhì)量,使模型可以在更少的數(shù)據(jù)和核算資源下取得更好的性能。另一方面,要加強壯模型與機器人硬件的深度交融,完成軟硬件的協(xié)同優(yōu)化。通過將機器人的傳感器數(shù)據(jù)實時反響給大模型,使大模型可以更好地感知環(huán)境、了解使命,然后做出更精確的決議計劃和舉動。
因而,王興興所提出的問題答案無疑是必定的,而大模型的“不行用”,并非數(shù)量不足,而是智能深度與實用性尚待質(zhì)的騰躍,這才是大模型該做的工作。對于開發(fā)者、研究者和投資者而言,關(guān)注點可能需要更多地投向基礎(chǔ)模型創(chuàng)新、高質(zhì)量數(shù)據(jù)構(gòu)建以及具身智能等前沿方向。 |
|