1月13日,第十屆新華網思客年會(山西)在臨汾舉行。世界工程組織聯合會前主席、中國新一代人工智能發展戰略研究院執行院長龔克在會上發表主旨演講。龔克認為,先進生産力的發展是阻擋不了的,人工智能是一種新質生産力,雖然目前存在一定的缺陷和風險,但不發展是最大的不安全。所以,要圍繞“應用、&&、數據、治理、人才”這5個關鍵詞,把人工智能從“聊天”推向“産品”。
圖為世界工程組織聯合會前主席、中國新一代人工智能發展戰略研究院執行院長龔克發表主旨演講。
以下為演講內容:
今天,我們該怎麼看人工智能?應該從三個重要的方面來看。一是它是一種新興的生産力,二是它經歷了重大的技術突破。第三點也很重要,它的發展還不成熟,存在風險。
2022年的11月30日,ChatGPT由OpenAI發布。它發布以後産生的效應幾乎超出了整個人工智能行業的預料。它可以模仿人類生成文本、圖像、視頻、音樂、軟體代碼。這些前所未有的能力讓它一下子在不到兩個月的時間裏面吸引了超過1億用戶,這標誌着數字化發展進入到了一個重要的新階段。
這個新階段從技術上看,是ChatGPT依靠大模型和一系列的技術組合造就的。特別是它實現了對語義的理解,這也正是非常難但具有突破性的地方。我們不要小看了ChatGPT這個應用。過去,人工智能可以和人下圍棋,把圍棋世界冠軍都下贏了,這是很了不起的事,但圍棋並不是所有人都能參與的,但每個人都會“聊天”。這一下子就把人工智能推向了所有人,這一點是前所未有的。我在這次來之前,就向ChatGPT問了一個問題,我問:“山西是煤炭集中的地區,人工智能能為這裡的産業綠色化轉型做點什麼?”他的回答是:“人工智能可以在山西的煤炭産業轉型過程中發揮重要作用。例如,人工智能與新一代數字技術如5G、物聯網、大數據、工業互聯網等一體化發展,可以推動煤炭上下游産業的協同,提高生産效率和安全性。同時人工智能也可以用於深化煤炭生産洗選節能降碳行動,有序推動煤炭與新能源優化組合,提升煤炭伴生資源和固體廢物綜合利用水平,實現煤炭行業的綠色轉型發展。”相當靠譜的一段話。它還説:“此外,山西省發改委已經發布了《關於煤炭産業和數字技術一體化發展的指導意見》……”我當時專門上網查有沒有這個指導意見,結果顯示真的有。而且我認真讀了這個指導意見,發現它確實抓住了意見中明確提出的“借助新一代數字技術推動煤炭綠色化、智能化改造的目標”這一點。這就是現在ChatGPT能夠達到的程度。
它的這種出乎意料的功能,在引起驚喜的同時也引發了很多專家的擔憂。所以,去年3月份有一大批名人集體簽名寫信要求把人工智能停下來。當然,他們也阻擋不了先進生産力的發展,阻擋不了這種新興生産力對舊生産力的替代。因為人類總是不斷地創造出新的工具,來提升自身能力,包括我們的體力和腦力。
所以在過去的一年多的時間裏,ChatGPT出現以後,它非但沒有停止進步,而且還在技術上加速地迭代,産業上也在高速增長。這個技術迭代我們可以用一個指標來看。在2022年10月30號推出的ChatGPT,它可以産生的內容有多長?包括標點符號在內是8000個英文字符,大約等於含標點符號在內的4000字的中文。3個月之後就翻了4倍到32000個字符,去年的10月份、11月初,在不到12月時間裏面又增長到了128000個。據了解,從去年到2030年,這個産業還將以年均37%的速度增長。
那麼為什麼會有這樣大的增長呢?歸根到底是因為它就屬於我們説的“新質生産力”。“從社會發展史看,人類經歷了農業革命、工業革命,正在經歷信息革命”。農業革命和工業革命是都是拓展了人的體力的,而信息革命是增強人的腦力,從而給生産力帶來的質的飛躍,就是“新質”,也可以説是“質變”,不僅僅是原有量的擴大,而是質的變化。在這個質變過程中,“人工智能是引領這一輪科技革命和産業變革的戰略性技術,具有溢出帶動性很強的‘頭雁’效應。”這個判斷非常重要,在這一輪科技革命和産業變革裏,以人工智能為代表的戰略技術是關係全局和長遠的技術,像“頭雁”一樣能引領方向。總書記進一步指出,“人工智能加速發展,呈現出深度學習、跨界融合、人機協同、群智開放、自主操控等新特徵。”他要求:“要深入把握新一代人工智能發展的特點,加強人工智能和産業發展融合,為高質量發展提供新動能。”這裡有一個詞很重要,叫“産業發展融合”。我認為,這不只是技術問題,還需要我們能突破現有的生産關係和行業管理。如我之前所説,人工智能是一種新型的新質生産力,具有很多新的特點。
第二,人工智能技術已經出現了重大的技術突破。突破在什麼地方?首先是量變到質變。現在所有人都談“大模型”,“大模型”有多大?ChatGPT剛出來的時候,大模型的參數有1750億這麼大的量,從2018年的ChatGPT1,到2019年這個是ChatGPT2,這個參數基本沒有變,只是算法有改進。然而到了ChatGPT3和去年推出的ChatGPT4,出現了數百倍的增長。在很短的時間裏如此快速的量變,於是從量變到質變的規律就發揮作用了。
從1750億到1萬多億,這個“參數”指的到底是什麼?我舉個例子。我們可以模仿人腦或動物的腦來構建神經網絡。這個神經網絡由很多神經元構成,神經元相互&&起來,我們不好處理,就把它們分成很多層,層本身互相不&&,每一層都只往下&&,一直到大腦皮層的刺激,到最後的輸出。我們説的參數就像是每一個神經元輸出時上面帶的系數。我們知道,猴子已經算很聰明的動物了,它具有很多神經元,但我們人的神經元比它多得多,所以人會記住很多東西,會進行複雜思維,但是單靠多也是不行的。非洲象的神經元比我們的多得多,但是並不如我們聰明。
這就説明,我們不僅要靠量變把我們的模型參數增大,還需要新技術的組合。ChatGPT是怎麼從輸入到輸出的呢?這一系列的過程就是把詞嵌入進去,“詞嵌入”(Embedding)這個詞在中文語境中很難理解。詞嵌入就是把一個詞嵌入到一個高維的空間裏面,高維空間裏的每一維代表着每一種性質,所有的性質來確定這個詞的詞義。我們舉個五維的例子,我們用一維&&它是生物還是非生物。如果它是生物的話,那它是植物還是動物?動物的話是哺乳動物還是非哺乳動物?飛的動物還是走的動物?如果它是走的動物,那它是四條腿的還是兩條腿的?用這樣的特徵空間確定這個詞的詞義,這就叫做詞嵌入技術。
還有一個技術叫做“自注意力”(Self-attention),這個技術可以通過一套機制在非常長的文章裏面找到文章的主線是什麼、關鍵點在哪。我們如果把一篇領導講話輸進去,它真的可以提煉出三、四條講話的要點,並加入了它自己的理解。
還有一個比較重要的技術就是人類的反饋強化學習(RLHF)。ChatGPT是可能出錯的,ChatGPT需要人來引導的,所以人類反饋強化學習對它非常重要。用這個技術,我們可以在問答中把我們人類的價值觀、倫理規範、科學知識輸入到這個模型中去,提高它的性能。現在招聘網站有一個非常熱門的崗位叫做提示詞工程師,他們做的就是給人工智能做人類反饋強化學習這個事的。
正是由於這些新技術,這種大模型的結合,人工智能實現了重要的技術突破。這個技術突破以後會給我們帶來新的工作模式,這個工作模式現在被稱作“模型即服務”(MaaS)。以前我們説軟體是服務、網絡是服務,現在模型也是服務。ChatGPT中的P指“預訓練”,在預訓練的基礎下加上整個行業的模型,就可以訓練它的下游任務,完成公式化。預訓練模型大大降低了我們運用人工智能的門檻。這樣行業內如果要做一個模型,不用從頭做起了,而是在現有開源的大模型基礎上來做,並根據最新的數據做精調,這也是為什麼人工智能能進步這麼快的道理。
人工智能使生産力有了重大進步,但是它還不成熟,它有一個固有的缺陷。它的生成方式主要靠概率分佈。既然依靠的是概率,它就有可能出錯。問題不在於依靠概率就出錯,人犯錯也是有概率的,我們平常遇到問題要尋求專家諮詢就是要降低人犯錯的概率。人工智能犯錯的概率是怎麼分佈的?什麼因素能影響它出錯?這些問題目前我們還不太了解,這叫模型的不可解釋性。所以説我們的研發要進一步解決它的可解釋性問題,才能有效控制它的錯誤概率。所以,我們説人工智能應用生成的東西是都是“半成品”,不能簡單地依賴它,而要對它進行審視。
面對這些風險,我們該怎麼幹?去年年底的中央經濟工作會議提出“以科技創新引領現代化産業體系建設”,並特別提出來要“廣泛應用數智技術”。我認為,我們要貫徹好中央經濟工作會議的精神,就要圍繞“應用、&&、數據、治理、人才”這5個關鍵詞。
首先是應用。我們必須把人工智能用起來,在用的過程中如果出現不好用的現象,我們就改進,重要的是要學會在應用中學習。現在有些人覺得自己沒有學過計算機,更沒有學過人工智能,所以他就不敢用這些應用了。其實沒有關係的,它們就像傻瓜相機一樣好用。這些應用僅僅被使用了一年就有明顯的進步。我們曾經做過調查,體驗過自動駕駛的人對自動駕駛技術的看法比沒體驗過的人積極得多。所以體驗過人工智能的,體驗過ChatGPT的人,對這項技術的態度也會積極得多。所以一定要把它用起來。正所謂“紙上得來終覺淺,絕知此事要躬行”。只有用才能發現它什麼地方好用什麼地方不好用,才會有機會跟別人合作,把它變得越來越好用。
第二,我們需要&&。人工智能是一個革命性的通用技術,而不是某一個行業的技術。當人工智能進入到某一個行業的時候,它就要和某個行業的知識去結合,這時候就需要&&的支撐了。據我們觀察,全國2205家人工智能企業在技術、資金、人才上是緊密&&的,這種&&的密切程度大大超過了其他同行業企業之間的&&。在這2205家企業裏面,我們觀察到有15家企業是科技部挂了牌的人工智能開放創新&&。這15家企業只佔全部企業數的千分之七,但是它形成的&&節點數佔比到了千分之一百五十,建立的關係數佔比千分之一百。説明&&在整個産業中非常重要。&&提供了數據、算法、算力和解決方案。&&還聚集了開發應用者、營銷者、投資者,因此&&非常重要。所以發展人工智能一定要依託&&,依託&&跨傳統行業的界線來進行産業發展融合。不能説機械行業就是機械行業,石油行業就是石油行業,人工智能能穿透這些行業,把這些行業整合起來。另外,人工智能還要跨所有制的界限,跨學科、技術的界限等。
第三,數據。我們説從通用的模型到行業的模型這個過程中,關鍵就是要將行業的數據和大模型有效地結合。現在的問題是我們各個行業內缺少高質量的數據集,所以我們必須把行業的、企業的高質量數據集建立起來。所以某個行業人工智能的成熟度在相當程度上要依賴這個行業的數據的成熟度。離開數據的場景,我們根本無法應用人工智能。
從治理的角度看,人工智能是一種新質生産力,我們就要按是否有利於解放和發展人工智能的生産力為要求發展人工智能。因為不發展是最大的不安全。所以,我們不要僅止於把它管住,還要建&&,做應用示範、安全保障、科學普及等工作。我們需要科技向善,而不是社會焦慮。
最後我們説一下人才。去年發布的一項人才需求度的報告顯示,人才需求度最高的行業是人工智能、電子芯片、新能源汽車、硬體等等。其中,人工智能對人才的需求量是遙遙領先的。而另一方面,我們看到企業採用人工智能最大的障礙是缺乏明確的戰略,缺乏適當的人才等。所以,我們現在必須立即着手培養和引進人工智能的創新者、應用者和管理者,用優秀的“人工”來保障“智能”的發展。人才是等不來的,而是要在應用中學出來、成長起來的。
歸根到底,我們現在就是要把人工智能從Chat推向Product,從“聊天”到“産品”。