瞭望 | 前瞻2024人工智能四大趨勢-新華網
新華網 > > 正文
2024 01/03 16:01:40
來源:新華社

瞭望 | 前瞻2024人工智能四大趨勢

字體:

  據消息人士稱,OpenAI正在訓練下一代的人工智能,暫名“Q*”(讀作Q-star)。新的一年,OpenAI下一代産品可能發布

  數據瓶頸指的是可用於訓練AI的高質量數據的有限性,合成數據有望打破這一瓶頸。除了對大量高質量數據的需求導致合成數據受到追捧以外,對數據安全的考量也是重要原因

  作為全球性能最強的AI,ChatGPT已遇到算力等方面的瓶頸。在此背景下,討論量子計算機在人工智能領域的應用就成為一種頗具潛力的未來解決方案

  文 | 譚笑間

  2023年,世人見證了ChatGPT在全球範圍的大火。以生成式人工智能為代表的新一代人工智能問世,改變了人工智能(AI)技術與應用的發展軌跡,加速了人與AI的互動進程,是人工智能發展史上的新里程碑。2024年,人工智能技術與應用的發展又會呈現出哪些趨勢?讓我們一同展望這些值得關注的重大趨勢。

  全模擬光電智能計算芯片效果圖。經長期聯合攻關,清華大學研究團隊突破傳統芯片的物理瓶頸,創造性提出光電融合的全新計算框架,並研製出國際首個全模擬光電智能計算芯片(簡稱ACCEL) 新華社圖

  趨勢一:從AI大模型邁向通用人工智能

  2023年,ChatGPT開發者OpenAI被置於前所未有的聚光燈下,也使GPT-4後續版本的開發被推向了風口浪尖。據消息人士稱,OpenAI正在訓練下一代的人工智能,暫名“Q*”(讀作Q-star)。新的一年,OpenAI下一代産品可能發布。

  據媒體爆料,“Q*”可能是第一次採用“從零開始”的方式訓練的人工智能。其特點是,智能不來自人類活動的數據,且其有能力修改自身代碼以適應更複雜的學習任務。前者使得人工智能能力的發展變得愈發不透明,而後者向來被看作是誕生人工智能“奇點”的必要條件。在人工智能發展領域,“奇點”特指機器擁有了自我迭代的能力,進而在短時間內迅猛發展,導致超出人類控制。

  雖然一些報道稱,“Q*”目前還只能解決小學難度的數學問題,距離“奇點”還遠。但鋻於虛擬環境中人工智能迭代速度可能遠超想象,其仍然可能在不遠的將來自主發展出在各個領域均可超過人類水平的AI。2023年,OpenAI預言,各方面超越人類水平的人工智能在十年內就會出現;英偉達創始人黃仁勳&&,通用人工智能可能在五年內超越人類。

  一旦通用人工智能得以實現,就可被用於解決各種複雜的科學難題,譬如尋找外星人與地外宜居星系、人工核聚變控制、納米或超導材料篩選、抗癌藥研發等。這些問題通常需要花費人類研究員數十年的時間來尋找新的解決方案,部分前沿領域的研究量已超出人力極限。而通用人工智能在自己的虛擬世界中擁有幾乎無限的時間和精力,這使得其在部分容易虛擬化的任務中,有可能成為人類研究員的替代。但屆時,人類如何監督這些從智能水平上超過人類的人工智能,確保其不會危害人類,又是一個值得思考的問題。

  當然,我們也不應過分高估硅谷巨頭們的部分言論,因為在人工智能發展史上,已經歷三次“AI寒冬”,其中不乏宏大的技術願景因各方面限制化為泡影的例子。但目前可以肯定的是,大模型技術仍然有着不小的上升空間。除GPT-4外,谷歌的“雙子座”(Gemini),Anthropic的Claude2,目前都是僅次於GPT-4的大模型,國內的百度“文心一言”與阿里“通義千問”,也是國産大模型中的佼佼者。它們在新的一年中是否會發布更具革命性的産品,同樣值得期待。

  趨勢二:合成數據打破人工智能訓練數據瓶頸

  數據瓶頸指的是可用於訓練AI的高質量數據的有限性,合成數據有望打破這一瓶頸。

  合成數據是在模仿真實數據的基礎上,由機器學習模型利用數學和統計科學原理合成的數據。關於什麼是合成數據,有一個較為淺顯易懂的比喻:這就像是在給AI編寫專門的教材。例如,儘管英文課本的對話中出現的可能是“小明”“小紅”這樣的虛構人名,但並不影響學生們由此掌握英語,因此從某種意義上,對於學生而言,教材就可以看作一种經過編纂、篩選和處理的“合成數據”。

  有論文表明,模型的規模至少要達到620億參數量後,才可能訓練出“思維鏈”能力,即進行分步驟的邏輯推理。但現實的尷尬在於,迄今為止人類産生的不重復的、可供訓練的優質數據並沒有這麼多。使用ChatGPT等生成式人工智能以前所未有的數量産生高質量合成數據,未來的AI將由此獲得更高的性能。

  除了對大量高質量數據的需求導致合成數據受到追捧以外,對數據安全的考量也是重要原因。近年來,各國紛紛&&更嚴格的數據安全保護法律,使得客觀上利用人類産生的數據訓練人工智能變得更為繁瑣。這些數據中不僅可能隱含個人信息,其中的許多數據還受版權保護。在互聯網隱私與版權保護尚未形成統一標準與完善架構的當下,使用互聯網數據進行訓練,極易導致大量法律糾紛。而若考慮對這些數據進行脫敏,又面臨篩查識別準確率方面的挑戰。兩難之下,合成數據就成為最惠而不費的一種選擇。

  此外,使用人類數據進行訓練,還可能導致人工智能學到有害內容。一些諸如使用日用品製造炸彈、管制化學品的方法,另一些則包括許多人工智能本不應當出現的壞習慣,譬如像人一樣在任務執行過程中偷懶、為了取悅用戶而説謊、産生偏見和歧視。若改用合成數據,使人工智能在訓練中盡可能減少接觸有害內容,則有望克服以上使用人類數據訓練時附帶的缺點。

  從以上分析中可以看出,合成數據可以説是頗具開創性的,有望解決此前發展人工智能與數據隱私保護不可得兼的問題。但與此同時,如何確保相關的公司和機構負責任地製作合成數據,如何製作出既符合本國文化與價值觀,又在規模和技術水平上足以媲美西方以英文網絡資料為中心的合成數據訓練集,也將成為中國面臨的一個頗具挑戰性的課題。

  除此之外,合成數據帶來的一個重大變化是,來自人類社會的大數據或將不再是AI訓練所必需。在今後的數字世界中,人類數據的産生、存儲和使用仍將遵循人類社會的法則和秩序,包括維護國家數據安全、保守商業數據秘密和尊重個人數據隱私,而AI訓練所需的合成數據則採用另一套標準進行管理。

  趨勢三:量子計算機可能率先應用於人工智能

  作為電子計算機發展到今天的最前沿應用,人工智能始終存在算力不足的隱憂。ChatGPT問世數月後,OpenAI總裁奧爾特曼曾公開&&,其並未鼓勵更多用戶註冊OpenAI。2023年11月,OpenAI甚至宣布暫停ChatGPT Plus付費訂閱新用戶的註冊,以確保現有用戶擁有高質量體驗。顯然,作為全球性能最強的AI,ChatGPT已遇到算力等方面的瓶頸。在此背景下,討論量子計算機在人工智能領域的應用就成為一種頗具潛力的未來解決方案。

  首先,人工智能領域的算法,大部分屬於並行計算的範疇。舉例而言,AlphaGo在下圍棋的過程中,其需要同時考慮對手在不同位置落子後的應對招數,從中找到最有可能贏得棋局的下法。這就需要計算機優化並行計算的效率來實現。而量子計算機擅長進行並行計算,因為它可以同時計算和存儲“0”和“1”兩種狀態,無需像電子計算機那樣消耗額外的計算資源,譬如串聯多個計算單元,或將計算任務在時間上並列。計算任務越複雜,量子計算就越具備優勢。

  其次,運行ChatGPT所需的硬體條件,同樣也十分適合導入當前體積龐大的量子計算機,二者都需要安裝在高度集成的計算中心裏,由一支專業化技術團隊進行管理支撐。

  什麼是量子計算機?量子計算機是一類遵循量子力學規律進行高速數學和邏輯運算、存儲及處理量子信息的物理裝置。其不僅體積龐大,而且作為核心零部件的“量子芯片”,通常需要被置於接近絕對零度(零下273.15攝氏度)的極低溫中,利用在這種極低溫下部分微觀粒子錶現出的量子特性進行信息運算和處理,且運行結果只能存在幾毫秒的時間。

  既然量子計算機“又大又難維護”,為什麼還要發展?原因在於,量子計算機蘊含巨大的算力潛能,以至於在一些算法上已經體現出相對於電子計算機在速度上的“絕對碾壓”,即“量子優越性”。但實現“量子優越性”只是一個起點。目前的量子計算機只能完成一些專屬於量子領域的計算任務,想要真正用好這種“量子優越性”,先要使其量子位足夠多,以實現通用計算和可編程。而且,在實現通用計算後,量子計算機依然需要保持相對於電子計算機的優勢,這被稱作“量子優勢”。

  2022年,來自谷歌、微軟、加州理工學院等機構的研究者從原理上證明了“量子優勢”在預測可觀測變量、量子主成分分析以及量子機器學習中確實存在。量子機器學習,實際上就是量子計算在人工智能領域的應用,也體現出未來量子計算與人工智能兩大前沿技術合流的趨勢。

  理論上證明了,實踐上就需要進一步拓展量子計算的應用前景。在2019年推出商用量子計算機“量子系統一號”後,美量子計算巨頭IBM又於2023年12月推出了“量子系統二號”。新系統的最大突破在於可以模塊化擴展,是該公司的首&模塊化量子計算機。“量子系統二號”擁有超過1000量子位。IBM還宣布計劃10年內建成10萬量子位的量子計算機。這些不斷增加的量子位並非只是為了競賽,其對於實現通用計算和可編程有着不可或缺的作用。也正因如此,量子計算機的模塊化,標誌着其更加具備實用性。

  有關量子機器學習算法的研究,已成為新的研究熱點。不過,未來量子計算機不會完全取代電子計算機,更有可能出現的是量子計算機和電子計算機在不同的應用場景下發揮各自所長,實現協同發展,既極大提升算力,也兼顧成本和可行性。

在上海舉行的2023世界人工智能大會上,人形機器人表演“千手觀音” 辛夢晨攝/本刊

  趨勢四:AI代理和無代碼軟體開發帶來“衝擊波”

  在AI應用方面,2024年值得關注的是AI代理和無代碼軟體開發帶來的“衝擊波”。

  一是AI代理對勞動力結構的衝擊。

  截至目前,全球至少已有近兩億人使用人工智能大模型。但人們已不再滿足於坐在電腦前跟AI“聊天”,而是開始開發能夠自動根據任務需要向人工智能發出提示的工具。當自動提示工具與大模型兩相結合,AI代理便由此誕生。

  2023年4月,OpenAI聯合創始人布羅克曼現場演示了GPT的“自動模式”。在該演示中,AI代理幾乎“包辦”了一場晚宴:不僅根據要求生成了一份晚宴的推薦菜單、一份圖文並茂的邀請函,還自動將該菜單需要購買的食材加入生鮮電商APP的購物車,並自動發布了一條有關該晚宴的社交網站帖子。

  AI代理還能根據比較模糊的需求提示自動製作網站,自動完成各種需要使用Office軟體完成的文字和表格處理工作,甚至自動根據已有論文數據進行歸納總結生成分析論文等。

  比爾·蓋茨近日發長文解讀AI代理未來,&&AI代理將徹底改變人們使用計算機的方式,帶來自鍵盤、屏幕和鼠標發明以來人類與計算機互動方式上最重大的革新。

  AI被看作對人類的信息收集、分析和處理進行增強的擴展性工具,使得人的工作水平更上新&階。但與此同時,AI代理也給許多現有的工作崗位帶來衝擊,因為企業可能嘗試雇用更少的人來完成相同的任務。這種由創新帶來的對現有經濟結構的破壞,被美國經濟學家熊彼特稱為“創造性毀滅”。隨着AI代理代替大量只需要較少的計算機技能就可完成的任務,這些被迫再就業的勞動力將不得不適應新的勞動力市場需求,這註定將是一個較長時期的、伴隨陣痛的過程。

  二是無代碼軟體開發給數字經濟創新帶來的影響。

  儘管生成式人工智能可能淘汰掉一批傳統數字崗位,但在關上一扇門的同時也打開了一扇窗,這就是“無代碼軟體開發”。目前,以AI大模型為基礎的編程輔助工具已經發展到一個新的階段,能夠根據用戶十分模糊的指令來生成軟體或網頁代碼。例如,2023年的GPT-4演示中,演示人員僅僅是在A4紙上手寫了一個十分潦草的結構示意圖,GPT-4就根據其自動生成了能夠實際訪問的網頁。這無疑大大降低了開發IT服務的門檻。只要一個人有足夠有創意的、能夠滿足許多人需求的數字服務“點子”,就可以成為互聯網創新的風口,“人人皆可創新”的時代已然到來。

  對此,政府需轉變觀念,兼顧市場監管與促進創新,一方面降低數字創新過程中的註冊與融資門檻,打通中小企業發展壯大過程中的痛點,讓就業與創新政策適應“人人皆可創新”的新需求;另一方面需要探索更有利於保護創新“點子”的版權與專利保護新政策,從而激勵那些能夠不斷提出創新“點子”的人才。

  綜上所述,展望2024年,無論是人工智能技術自身的迭代發展,還是其對數據價值的重塑,抑或是向各行業、各領域的應用滲透,人工智能的影響可謂無處不在,既為科研、創新和經濟賦能,又帶來新的挑戰與風險。我們應以開放的心態看待人工智能帶來的諸多改變,審慎研究和應對其可能帶來的新課題與新風險。

  (作者為中國現代國際關係研究院科技與網絡安全研究所人工智能項目負責人)

【糾錯】 【責任編輯:劉陽】