專訪丨竇德景:讓國産芯片用起來、跑起來-新華網
新華網 > > 正文
2024 07/15 17:10:00
來源:新華網

專訪丨竇德景:讓國産芯片用起來、跑起來

字體:

説起算力、數據可信、模型架構等專業術語,對於多數外行人而言,可能會感到既晦澀難懂,又仿佛這些概念高不可攀,難以捉摸。然而,在近日召開的北電數智“前進·AI異構計算&&”發布會上,記者採訪到了發布環節的主講人——人工智能領域的著名專家竇德景,作為北電數智首席科學家的他,分享了自己對“數據安全可控”與“國産芯片自主創新”的獨特詮釋。

計算機科學家、名校教授、頂級諮詢公司合夥人......儘管身份眾多,但在一問一答間,記者卻深深感受到了一位研究和教育工作者的熱忱。整個訪談過程中,竇德景以其深入淺出的講解,讓複雜的技術問題變得通俗易懂,久違的課堂感,讓記者對人工智能的複雜概念和技術細節有了更深刻的理解。

北電數智首席科學家竇徳景

 

基座大模型瘋卷模型參數,AI是一本經濟賬

由於行程較緊,初見竇德景,便被“劃重點”似的推薦了關於人工智能領域的權威文獻及新聞報道,然後竇德景從AI技術在相關行業場景應用如何落地展開講解,並着重強調了AI經濟賬的重要性,儘管科研投入的直接經濟效應難以量化,但其成本和産出的關係相對容易計算。相比之下,行業應用中的AI經濟賬則更為複雜。

他舉例解釋説,“在蛋白結構預測領域,傳統方法如冷凍電鏡鑒定的成本高達上億。如果使用AI技術能夠以更低的成本獲得比較準確的結果,那麼AI就展現出了其明顯的優勢。”

“現在問題是在全球範圍內,不管哪個行業用了AI,投入了大模型,最後企業能否營收划算,這還是很困難的問題。”他認為在沒有出現殺手級應用的情況下,如何確定投入與産出的關係,這是一個需要深入研究的問題。因此,儘管AI技術在科研領域取得了顯著進展,但在實際應用中,如何量化其投資回報率(ROI)仍是一個挑戰。

同時,在全球範圍內,AI技術的發展正推動着算力資源的爭奪。基座大模型的競爭不僅是模型參數的卷積,更是對底層異構技術的需求。

對此,竇德景提出了一個引人深思的推測:儘管人腦擁有約100萬億參數(注:神經元連接的數目),但實際使用中可能僅涉及其中不到十分之一,因此,10萬億參數可能是AI模型發展的一個關鍵節點。“以後就是這樣的發展趨勢,我覺得10萬億會是一個門坎。”他進一步解釋説,一旦達到這個量級,模型的優化將不再依賴於參數規模的增加,而是轉向其他方面的改進。

因此,為承接萬億參數的模型,未來推動萬卡集群的建立也是勢在必行。而在當下一超(英偉達)和多強的算力環境裏,如何有效利用現有多元算力資源,提升AI産業的核心競爭力的同時,降低企業使用AI算力的門檻並助力AI産業發展,也是從國家到社會,再到北電數智這樣一家人工智能原生的國有企業在思考、在投入的事。

讓國産芯片從實驗室走向現實應用

談及國産芯片的發展,竇德景坦言:“我們北電數智的一個任務就是讓不同的國産芯片一起跑起來,現在已經初見成效。”

芯片發展關係到數據安全。因此,發展多種適配技術,可以更高效地利用國産芯片處理不同類型的數據,同時確保數據的安全性和模型的性能。

在向記者解釋“混元適配”概念時,竇德景認為這個概唸有一個很重要的方向,也是當前企業的重要任務,“通過集成各種芯片以提供綜合算力,並在雲&&上運行多樣化的大模型,包括基礎模型和特定行業的定制模型,其中不同的芯片將根據其在圖像處理、視頻生成、文本處理和語音識別等不同領域的專長髮揮各自的優勢。”

相較於市面上眼花繚亂的芯片參數,在現實環境中應用芯片到大模型訓練和推理至關重要。這不僅需要依賴芯片廠商在測試環境中提供的報告,更要在實際的政務、醫療、文化等大模型中進行實際測試,利用真實數據來驗證性能。

從“誰來用”到“怎樣用”,通過舉例論證,竇德景一一作出解答。“每個芯片廠商都會説自己的芯片不錯,北電數智作為一個有國資背景的企業,沒有跟任何芯片廠商做綁定,是可以提供較為公正、客觀的評測意見。”竇德景指出,在高性能計算領域往往需要多卡並行,然而由於卡與卡之間需要互聯,這可能會導致芯片的實際性能低於單卡原本性能。他還&&,“我們通過對芯片進行實際場景深入評測,獲得芯片實際運行結果,並形成對廠商具有指導意義的評測報告。這不僅需要國家的大力支持,也需要在實踐中不斷驗證和優化,以確保實驗室的理論成果能夠在現實世界中發揮應有的作用。”

讓國産芯片實現從“可用”到“好用”的轉變,是無數以竇德景為代表的人工智能領域專家學者,對國産芯片跨越式發展和確保數據安全可控的堅定信念與殷切期望。也正是他們從實際應用場景出發,真實準確地評估,助力國産芯片優化,提高其競爭力。

臨近採訪尾聲,談及與北電數智攜手同行,他期待可以共同研發更多能夠快速落地的技術産品,通過加速芯片混用、降低智算成本,從而推動國産芯片的繁榮。“雖然國産芯片在技術成熟度和市場應用方面與國際先進水平還存在一定差距,但通過不斷的技術創新和産業生態建設,完全有信心實現國産芯片的突破和發展。”竇德景説。(文/朱家齊)

 

竇德景講解大模型訓練幻覺問題:

在短暫的採訪中,竇德景也特地針對大模型及行業發展所面臨的挑戰“着墨良多”。

作為新時代的基建,乃至國家間科技、經濟競爭的焦點。大模型的訓練依賴於大量的數據。可如果這些數據中存在錯誤信息或帶有偏見,模型在學習過程中就會吸收這些缺陷,導致在生成文本時産生模型幻覺。

“幻覺問題通常發生在模型試圖生成與事實或者歷史相關的答案時。例如,當問到‘姚明是否獲得過奧運獎牌’時,模型可能會基於姚明在籃球領域成就相當的人和奧運獎牌的關聯性,錯誤地生成肯定的答案。而即使存在明確的歷史事實和正確答案,模型也可能因為生成算法的特性而給出錯誤信息。”竇德景説。

不同於發布會現場直播時的鄭重其事,訪談中的竇德景,在解釋較為複雜的概念問題時,往往簡明扼要卻又通俗易懂。記者又以自身實例&&,在利用模型搜索自己的作品,並通過替換同事姓名搜索各自作品的時候,發現生成的結果卻出奇地一致。

對此,竇德景解釋,當提到相關媒體時,模型可能會自動聯想到最有名的記者,這是一種聯想偏差或自注意力偏差。竇德景進一步解釋説,“在我看來,現在幻覺問題基本上已經解決了,幻覺問題怎麼産生的?你本來問一些事實和歷史問題,如果讓它生成,這本身方向就是不對的。生成式AI給你的答案是概率最大,或者説最應該發生的答案,比如,和姚明一樣的籃球運動員很多都得過奧運獎牌。模型可能會更關注籃球運動員和奧運獎牌的關係,從而忽略姚明,進而給出姚明得過奧運金牌的答案。這種錯誤我們叫模型幻覺。模型幻覺産生的原因是因為模型的關注度出現了偏差,將重點錯誤的附着在了非重要的詞段上所導致的。

“北電數智目前在北京市某委辦局政務大模型上就很好的規避了這個問題。在技術層面,通過基於注意力區域合理性分析的幻覺監測技術,能夠校驗模型是否産生了幻覺,並通過對區域關注度的調整,降低了模型産生幻覺的概率。同時還通過創建一個安全可控推理鏈,實現對政務敏感詞的篩選和屏蔽,確保模型互動過程中能夠降低或者杜絕錯誤信息,提升模型問答安全合規的同時降低了模型幻覺。這對大模型在政務場景下的應用是非常有意義的。”

【糾錯】 【責任編輯:周靖傑】