閔萬里:打通數據、算力、算法“孤島”,助力AI賦能産業轉型升級

發表於:2024-11-15 14:49:36

  以“中國經濟的下一程:塑造新動能 釋放新活力”為主題的新華網思客雲丘山年會10日在山西臨汾市雲丘山舉辦。深圳清華大學研究院數字化工程服務中心主任、神思電子首席科學家閔萬里在題為《數智化賦能産業轉型升級》的主旨演講中&&,目前數智化發展存在三座孤島——數據、算力、算法,若能理順三者關係,實現打通和融合,就能更好服務數智化賦能産業轉型升級的進程。

深圳清華大學研究院數字化工程服務中心主任、神思電子首席科學家閔萬里發表演講

以下為演講全文:

  以數智化賦能産業轉型升級是一場智力革命。講到了智力,就離不開講科學和技術。

  科學幫助我們建立人類對社會的基本面的運行規律,也就是“去發現”,而技術是我們利用這些規律“去發明”那些可以改造社會的生産勞動的工具。而這兩者的結合就能瞄準産業當中有價值的問題,然後通過解決問題來創造價值。

  上面這張圖我想在500年前也是同樣成立的,只是很可惜,那個年代沒有資本的風投,只有一些民間企業家,政府的投資行為還比較少,那時科學和技術還是兩個概念。

  所以上圖這個公式如果成立的話,就一定會有短期資本直接注入到産業當中去,進而擴大産能、擴大再生産,然後大規模佔領市場。長期的資本會投資技術,但是很遺憾,資本很少投資科學。為什麼?從科學到技術的轉化是非常艱難的。

  我們都知道牛頓在他那個年代寫下了萬有引力公式,但是他沒有融到資。相反,愛迪生利用法拉第電磁感應定律、麥克斯韋方程組,最後發明了電燈泡,結果他就融到了資。JP摩根成了他的“天使投資人”。

  所以我想這張圖其實給我們很多啟示。要用數智化去賦能産業升級,首先要找準價值創造。價值創造成立的前提下才會有短期和長期這兩種資本出現,當然這裡頭一個最大的前提就是科學,如果沒有新的科學認知,這個事就走不了多遠。

  什麼是科學?我們用400年前的“大數據”舉一個例子。

  伽利略發明了望遠鏡,幫助他總結了天體運動的數據。根據那個年代的“大數據”,最後得出開普勒三定律。開普勒告訴大家,行星都是繞着太陽走,太陽是橢圓形軌道當中的一個焦點,單位時間內掃過的面積是多少等等……他基於這些“大數據”給出了描述。到這個地方為止,他發現了一些規律,但是沒有人去解釋這個規律背後的基本原理,也就是“第一性原理”是什麼。而牛頓的萬有引力公式做到了這一點。牛頓精準地預測了整個天體運動的行為,並且告訴大家在太陽系之外還有其他星系,後來事實證明了這一點。這就説明,在懂得科學原理之後,你可以突破人類認知的邊界,不斷去上探價值的新高點。

  同樣的道理,我們來看一看人工智能究竟咋回事。

  人工智能經歷了從AIGC(人工智能生成內容)到AIGD(人工智能生成決策),從感知到思考到行動的轉變過程。大家都在講大模型的生成,其實人工智能是什麼?從圖像的識別上我們可以分為幾類。圖像有什麼?是一個什麼樣的事情?看到了之後我們該怎麼辦?其實就這三個問題。相當於從哲學三段論的觀點來説,就是“有什麼”“幹什麼”和“怎麼辦”。同樣的,如果你去讀一篇文字,道理也是一樣的,這個文字講的什麼主體?它的意思是什麼?讀了之後我該怎麼辦?這也是一個新聞報道或者輿情描述的基本邏輯。再比如,如何處理一段語音?你聽了之後要把它轉化為文字,再做實體的識別,然後再去看語義的理解,再問“怎麼辦”。所以在這個過程當中其實不外乎就是三件事:一是視覺、聽覺;二是語義的理解;三是我們個人的行動。這裡面最重要的是什麼?不是AIGC,而是AIGD。這裡的“D”意思是decision,也就是決策。當然,我們解決實體産業問題的時候,我們是需要用行動落地的。智慧上天,行動落地,落得越深,創造的價值就越深厚持久。

  回到那句話:科學是什麼?人工智能的科學是什麼?我們把科學的問題搞明白,就能知道我們在哪發力。

  大家都知道,大模型是數據、算力和算法的結合。2022年最火爆的大模型ChatGPT用到的模型數是多少?1750億個參數。為什麼是這個數?這裡面有一個非常深刻的科學道理,一會我給大家解釋。

  另外一方面,人工智能領域又有一個很神奇的術語叫“神經網絡”。我們每一個人身上都有一個神經網絡,就是人腦。人腦這個神經網絡是一個由860億個神經元組成的巨大網絡。每一個神經元都在放電,放電了之後信號開始傳遞。我們經常講“頭皮發麻”,其實你在“放電”而已。一見鍾情就是對那個人,也就是那個特定的“頻道”發生了太多的電流活動,然後一下就産生了情感的共鳴。

  上圖的右上角是20年前我在紐約做研究的時候,我的研究團隊的一個志願者被監測腦電波的照片。從他放電行為體現出的那樣一個“尖峰”,就能看出哪一個頻道放電行為特別活躍。

  我為什麼又把860億給標出來了?我們的人腦中,每一個腦細胞都有兩種狀態,一種是沒有被激活的狀態,一種是放電被激活了的狀態,關鍵在於被激活的佔多少。也就是説,如果要描繪一個人腦神經網絡的狀態,需要2×860億個參數,每個腦細胞需要兩個參數,總共是1720億個參數,也就是説任何一個人對一種語言、圖片或者視頻的反應都可以用這1720億個參數的巨大模型,完美地去呈現它。

  所以,大家就能理解為什麼ChatGPT出現的爆發點是在1750億個參數,而不是在100億或者幾百億的量級上。這背後就是這樣一個深刻的科學道理,就是我們人腦的所有活動如果需要一個數學模型描述,總共1720億個參數就夠了。

  講完這些科學成果之後,下面我們就來講怎麼賦能産業。

  其實,命題、破題、選題、解題這4個步驟就在這個公式裏面,包括三個核心要素:數據、技術和産業知識。很遺憾,很多時候大家忽略了産業知識、産業專家的重要性。行業專家的知識能夠起到“四兩撥千斤”的作用,如果我們用得好,會少走很多的彎路。

  在賦能的過程當中,我們有兩個指標要去看。一個是效率,一個是效果。過程是講效率,結果是講效果,這兩者的提升都有可能起到賦能的作用。

  接下來我會給大家講四個我親自幹過的案例。他們各自有一定的代表性,既有政府手上的數據,也有企業的數據,既有基礎民生智慧城市領域,也有製造業的……

  這裡面講到的行業知識就是機理模型,講到的人工智能就是數據模型,這兩者結合缺一不可。

  核心是要幹什麼?就是要把一個製造業的車間想象為一個神經網絡,從人(人員)、機(機器)、料(原料)、法(方法)、環(環境)五大要素去解構它,做數字孿生,讓産線“學會思考”。

  我們來看一個例子——單晶硅。這是兩年前在四川我帶着團隊幹的一個案例。單晶硅是太陽能光伏的上游産業,也是我們很多晶片、晶圓的“上游”。

  單晶硅的生産其實很有意思,主要是把石英砂加熱到1400多度,然後在向上提拉的過程當中晶體生長出來,而如果提拉的速度不合適,它就“砰”一下斷掉了。在老師傅的幫助下,我把整個流程畫出來了。

  當我畫了這個流程之後,我就要加入人工智能相關的事。這個時候就要建立一個數學模型去抽象它。怎麼建?很簡單。把每一個環節當中所有的參數變量,包括可控的和不可控的關鍵性變量,全部畫出來,形成這樣一個“神經網絡”之後,下面就有一個很神奇的事出現。

  當有這樣一個網絡之後,我需要添加“輔助線”,就像我們在中學學幾何,要添加輔助線去證明一些定理一樣,在這裡有沒有可能我添加一些“輔助線”,發現某幾個變量的組合,完美地決定了最終的結果。這就是構建一個“神經網絡”的關鍵。

  我們把很多層“神經網絡”的一些通道鏈結在一起,最後找到了直通最終結果的決定性變量,這裡面這些結合虛線代表的是權重,就是α、β、γ等那些系數。

  這樣一想,突然你發現,原來人工智能跟産線有這麼神奇的交互,或者説叫同構映射。當我們建立這樣一種數字化孿生之後,效果就出來了。所有的海量數據全部映射到這個圖上,最後讓人工智能去找這樣的“輔助線”,找到之後直接看效果。

  人工智能跑了一個多月之後,得出了下面這張圖。

  當中我們只需要關注最後那一列。這列的第一行是人工智能跑的,另外幾行全部是老師傅跑的,做“人機大戰”,結果就是人工智能的斷線率比老師傅的還要低,産能也上去了,利潤也上去了,重要的是這個過程中沒有花一分錢去改造硬體,沒有做工業互聯網,也不需要5G。為什麼?所有的數據都在這個企業的硬盤上。它以1300個單機爐已經跑了兩年多,積累了海量的數據,積累了相當多的樣本,得出有40%左右的斷線率,只是以前沒有人工智能的算法和模型以及算力去幹這個事。

  當這些數據出來之後,我想所有人都不再質疑了,人工智能確實能幫産線多賺錢,而不是“幫工人打卡”這麼庸俗。現在的問題也不是人工智能行不行,而是這家企業行不行,或者同行的單晶爐能不能幹這件事的問題。

  所以我想對於一個製造業企業來説,在“龍頭”打開一扇窗,讓大家看到新價值創造的模式,它所帶來的這種衝擊力是用數字來説話的,不是靠圖像。

  下面再講一個更加傳統的行業。咱們北方冬天要供熱,可你能想象一個有50年歷史的地下熱水管網,它的那些閥門究竟該如何控制?根據寒潮的去來,然後怎麼提前開閥門?這件事能不能用人工智能來幹?我給大家講,即使是這個“土得掉渣”的行業,答案仍是可以幹,而且可以幹得非常好。這是我2023年11月15號到今年3月15號在山東濟南帶着團隊幹的一件事。

  其實傳統的人工調節是要怎麼幹呢?左邊這張圖大家能看到,當熱源廠把熱水的溫度提起來之後,由近及遠慢慢流到居民小區,它有一個漸進的過程。在這個過程當中熱水來了,然後溫度就升起來了,所以它是有先後順序的。

  但是冷空氣來的時候是一下子就到了。所以説,按傳統的方式必然會造成有的地方冷空氣來了,但小區裏還是很冷;有的地方冷空氣還沒到的時候小區裏面已經很熱了,不平衡。如果人工智能要怎麼幹?

  人工智能要幹的話就是按每一個閥門精準地去調,提前去調,有的地方先調大流量,有的地方先調小流量,根據熱源廠的溫度變化。這件事情感覺很簡單,但是做起來特別難。為什麼特別難?

  給大家看下面這張圖就知道了。

  有很多閥門“不聽話”,因為它們已經有幾十年的歷史了。你把閥門開大到5%的時候,它最多只能給你開到2%。也就是説你要精準指揮一群“不太聽話的士兵”,去精準地“打一場仗”,而且不僅僅是要算得準確,還要算出、預判出它的反應,從而給它一個指令,讓它能夠最終達到你想要的效果。

  那麼除了更精準,人工智能還會帶來哪些好處?答案就在這張圖上。

  這些數據模型要怎麼做?這點我跳過去了,直接看結果——節省了3%的能耗。我們在整個縣裏50多個換熱站幹了這個事之後,得出了這個數,就寫在最後那一列的那張表上,這是我們的客戶統計出來的。

  3%是個什麼概念?可能大家覺得很少。但是首先要明確:這是凈利潤,它沒有投入,是零成本的,它不需要改造設備,現有的基礎設施上的閥門怎麼調,用人工智能算一下,然後執行下去,這樣就有一個“軍師”時刻幫你算,然後這樣執行下去就能節能3%。在濟南230萬個採暖用戶每年的成本大概是六七十億。六七十億的3%是多少?大概兩個億左右。這還是1.0的版本。所以我想,人工智能對於製造業企業,尤其這麼傳統的製造業企業來説,可以使它找到新價值創造的方式。

  所有的“鑰匙”都在手上,有數據、有懂模型和機理的老專家,而且場景也是原來的場景,唯一缺的就是智力和算力。當我們把它需要的東西精準注入的時候,這家企業就能賺錢了!

  下面一個就更簡單了。這是一個我們所有的人都知道的案例。

  開車的時候有時你會發現綠燈的方向沒有車,但是綠信號燈還頑強地“綠”着。那一刻,你是否會想:為什麼信號燈這麼不聰明?看到路面上已經空空如也了,它還要“綠”着?因為我們知道它是按照固定的模板在倒計時。

  接下來我們就把人工智能用上去了,完美解決了這個問題。

  如下圖顯示,該路段21:00:26東西方向出現空放,原定持續83秒,3秒後發現空放。AI生成變燈策略,1秒後策略下發。行人燈閃,黃燈變燈完成,11秒後執行完畢。實際空放15秒,節省時間68秒。

  這一個例子中,它的難處不是在識別空放,它的難處是讓20年前的信號燈能夠及時跟上我們今天這個時代的節奏。

  能算得出來,也算得很快,但是執行器如果不夠快怎麼辦?我們通過人工智能把這個路給打通了。

  下面再講最後一個案例——防汛。

  這兩年,個別城市在洪澇災害中都被淹了。今年夏天,我們在濟南做了一個嘗試。

  我們把低窪地段的色塊周邊的攝像頭提前“點亮”。當我們知道將要降雨的時候,總共3300多路攝像頭在降雨三個小時的時間裏面,被我們每30秒鐘提取每個攝像頭的數據,以此用來實時計算低窪地帶積水的深度,以及統計是否有人被困。

  這個事也看上去很簡單,對吧?它的難度在哪兒?要把3G時代建設的攝像頭“拉流”,進行實時的計算,幹5G時代的事。用3G的基礎設施幹5G時代的事,這一點在技術是有挑戰的。但這個業務的社會價值很高。

  這是一個真實的案例,上圖這位老人當時通過一個下穿橋,水流太急,老人因為腿腳不方便,倒下去了。我們的人工智能算出這個地方的水位高了,然後發現有個人不動,最後把這件事從後&“彈窗”出來之後,聯動交巡警,才把他解救了。通過這個活生生的案例,尤其對於這位老人來説,人工智能的價值一下就顯現出來了。人工智能不能阻擋洪水,但是它能夠幫助那些老百姓至少早一刻鐘逃離這些洪水。

  我想這就告訴我們一個事實,那就是人工智能如果深入到産業當中去,是能夠解決很多以前解決不了的問題的。所有的要素都在,只是以前沒有被整合。

  最後,我想用一個故事來收尾。

  兩千多年前阿基米德聚焦幾百面鏡子,燒了敵人的船。兩千多年後,在青海,我們有幾萬面鏡子去反射陽光,聚焦熔岩電廠。跨越兩千多年的兩個完全不一樣的形態,但它們的道理是一模一樣的。如果我做個比喻,那些陽光就是源源不斷的數據,那些鏡子就是我們計算的芯片,而把陽光精準對焦到一個焦點,這種方法就是算法。

  阿基米德他幹的就是數據加算力加算法的事,而兩千多年後在青海這個地方還是一模一樣的,只有用數據加算力加算法來聚焦,才能融化,融化了才能突破。

  剛剛講的這幾個案例中,其實我們就是在重整、解決算力、數據和算法的生産關係的問題。

  在今天的數字化時代,最大的三座“孤島”正在形成。這三個新的“孤島”一個是數據,一個是算力,一個是算法。我們的算力中心特別多,我們的數據也特別多,都是互聯互通的,但是有數據的地方沒有算力,有算力的地方沒有數據,更沒有算法。如果它們的生産關係沒有理順,我們幹不了前面説的那些事。當我們把三者的關係給理順之後,其實人工智能的突破,尤其是人工智能在産業的突破就是自然的事情了。當産業的數據已經極其豐富的時候,有數據、有場景、有算法,那就“三缺一”只缺算力了。

  所以我們需要在這個時代重新理順生産關係,在頂層設計上去打破數據、算力、算法的“三國演義”,打破它們三分天下的局面,讓數據、算力和算法不要彼此“走迷宮”,把它們三個放在同一個反應容器當中,催化價值反應的過程。我認為這是我們在數智化轉型賦能産業升級過程中必須要做的一件事。技術的人幹技術的事,搞“神經網絡”,但是頂層設計的人必須重整生産關係,才能達成我們呼籲的“以價值創造來引領新質生産力的發展”。