半月談記者 張漫子
“我們希望機器人幫助人類掃地、洗碗,是因為人類要去寫詩、畫畫。現在機器人都去寫詩、畫畫了,人類卻還在掃地、洗碗。”
網上的這個段子聽上去搞笑,卻暗含對人工智能的深層追問:生成式人工智能飛馳,帶來的推背感固然令人興奮,但人類究竟需要怎樣的智能?“規模化”的大模型之路能否帶我們去往那個理想之境?
一年多來,看漲大模型的聲浪已經很高。這一次看看熱鬧之外的另一面,看看裏面隱藏幾多陷阱幾多“坑”。
後發者陷阱
春天是人工智能故事密集的季節。GPT4發布一周年之季,Figure01成為第一個“拿起蘋果”的人形機器人。這一天距離被視作“世界模擬器”的Sora誕生還未滿月,OpenAI和Figure官宣合作僅過去13天。
國內,“百模大戰”依舊激戰正酣。大模型卷出了新高度,一邊“卷參數”、一邊“拼落地”,消費電子廠商競相把大模型裝進手機,技術與産品加速迭代。多方紅利釋放下,産業似乎一片向好。但模型與模型之間,更多的是趨同。模型林立、參數浩瀚,但剝開外殼,想要找到夠用的、扛打的、鶴立雞群的,其實不太容易。
從GPT到Sora,同樣的問題又一次擺到國內廠商面前:如何追趕、如何復現。每一次現象級“王炸”問世後,扎堆跟隨成為不少從業者的路徑依賴。
這種習慣由來已久。過去很長一段時間,是後發優勢讓我們嘗到了甜頭。後發者引進先發者的技術和經驗,能避免大量試錯糾偏成本以獲得更快發展。畢竟自己搭梯子去摘高處的果實費時費力,還是“低垂的果實”撿起來多快好省。
然而,成長期的大模型,像魚需要水一樣等待算力、數據、資本、人力、能耗的投喂。這些因素過半受制於人或滯後於人時,後發劣勢就會逐步顯現。此時,先發者興許早已坐收漁翁之利。
2023年7月6日,在2023世界人工智能大會展會現場拍攝的特斯拉機器人。方喆 攝
1848年,美國加利福尼亞發現了金礦,無數淘金客從世界各地涌向西海岸。10年過去後,大部分淘金者不僅沒有發財,反而流離失所,而金礦旁邊賣鏟子的人最終得到了暴利和財富。
如今,大模型這波熱潮,還沒真正讓多少人嘗到實惠,但“賣鏟子”的英偉達如同大象坐上火箭,率先成為贏家。出門走一走,幾個創業者中總有一個在做大模型。有句話説,大模型創業者睜開眼就能看到對手。但今天,特別是在越發細分的AI級別芯片市場中,英偉達已經沒了對手。
路線陷阱
站上風口的大模型光芒有多耀眼,其他技術路線的背影就有多落寞。這幾年,大模型忙着刷參數、搞“軍備競賽”,但打敗它的往往不是大模型。
時下最熱的是自回歸生成式路線,即大數據、大模型、大算力的“暴力美學”。從GPT到Sora,都是這一路線的代表産物。它的最大信仰是“規模”(scaling law)——“有疑問時,那就擴大規模”“如果還不夠好,那就擴大規模”。
過去一年,“暴力美學”連贏兩次,但這條路值得我們集體梭哈嗎?
回溯技術發展史,路線之爭一直伴隨着人工智能的發展。沒有一種路線始終獨佔上風,而是螺旋式推動技術向上走。另一方面,選擇“暴力美學”需要算力的優勢。而我們,算力遭到掣肘;投資,不比3年前充裕;數據,質量和數量是否夠用有待時間檢驗。200多個(可能更多)大模型在嗷嗷待哺,等待無止境的算力投喂。與能夠把一萬張GPU連起來用的公司相比,時間窗口正不斷錯過。
大模型的盡頭是AGI(通用人工智能)嗎?至今,大數據、大算力煉出的大模型,實現的仍是小任務:回復一段話、做一段視頻。這些任務如果交給人類大腦,也許只消耗25瓦的功率,但交給大模型之後,這個計算量就需要把一萬張GPU連成串……這是“大數據、小任務”與“小數據、大任務”的不同。當我們琢磨起自己的每一個閃念、每一個行為是如何産生,其實不難發現,一些重要的任務、重要的功能根本無法在規模上無限擴展。
前者好比“鸚鵡學舌”,模仿人説話,既無法解釋也不能理解。後者好比“鸚鵡喝水”,複雜架構,無需很多數據,卻能實現感知、認知、推理、學習、執行等行為。
事實上,先發者已在看不見的地方,分散佈局多點開花。後發者卻信了風口造神的神話。
眼下,大模型建設如火如荼,越做越大,也越來越“貴”。最新的AI芯片一顆已經超過3萬美元,還不是想買就能買得到。一個百億級參數的大模型每天的用電量相當於1.7萬個家庭的日用電量總和。“暴力美學”不燒腦,但真燒錢啊。
哪怕這條路追得起,跟隨的人也總在霧裏看花,風口來了一哄而上、泡沫破了一哄而散。因為不知其所以然,所以既不懂得什麼應當捨棄,也不知道什麼時候應當停下。
認知陷阱
向前看,人類依然期望在硅基上創造一個“人類鏡像”。AGI的終極目的依然是讓計算機像人類一樣智能。AI也依然是那個改變“我們是誰、我們能做什麼、我們成為什麼”的技術。但仍有相當多的問題沒有形成共識。
什麼是智能?是數據海洋裏的涌現嗎?相比於有問才有答的聊天界面,人類是實境生物。人的生命力源自改造世界的實踐,AGI的實現終將建立在與真實世界的互動之中。
而今天,等待人類投喂的大模型,還是一個被動接收的信息壓縮器,不依賴內部意圖驅動,也尚未形成感知世界、收集信息、歸納整合、提出理論、應用實踐、修正理論的閉環。因此,自回歸生成的語言、內容僅與人類的語言、創造有表面的相似,卻沒有內在機制的因果關聯。
2023年10月17日,工作人員介紹應用大模型的智能駕駛艙。張漫子 攝
沿大模型的路走下去,如果新生的萬物皆由過去的數據生成,那麼世界如何朝前走——亞裏士多德提出的“重的物體落地快,輕的物體落地慢”理論但凡被機器學習之後,伽利略的比薩斜塔實驗就不會再有了,更不會出現推翻亞裏士多德的“自由落體理論”了。
人類的重大發現,最初往往是基於一種實境中的違反邏輯的直覺,一種基於對現實和已有理論批判的頓悟,而不是對既有理論、歷史結論的歸納、推演。
AI的進階,既是一道工程問題,也是一道科學問題。不能僅運行在虛擬世界的語言、圖像的生成之上,而應真正與現實交互、關聯。
或許,在物理世界與數字世界中學習進化,以在理解世界、與世界交互的基礎上完成複雜任務為目標的具身智能,將為AGI補全最後一塊拼圖。
下一波智能的競爭中,在算法、工程、數據、場景、軟體、硬體交織雜糅的,從基礎電機到減速器、控制器再到機械臂、靈巧手都需要持續技術突破的競技場上,我們能否擺脫後發者的追逐、形成獨特的核心優勢?
通用人工智能這張“餅”夠大。但要避得開陷阱,才能接得住富貴。