第二十屆中國計算機大會(CNCC2023)將於2023年10月26日-28日在遼寧省瀋陽市舉行。 經過二十年的發展,CNCC已成為我國計算機學術與技術産業各領域廣泛交流的&&。作為學術、技術、産業、教育各界在計算領域共同探討交流的年度盛會,CNCC的影響力逐年遞增。
在模擬人類對話及解決數學問題上表現出驚人進展的大語言模型,是近幾年人工智能發展最熱門的領域之一。然而大模型在以數學推理為代表的複雜推理上表現欠佳,難以應對數學領域的研究難題。暨南大學教授、廣東智慧教育研究院院長劉子韜將圍繞《大語言模型在數學領域的前瞻問題與挑戰:理論、方法與應用》作精彩報告。圍繞相關問題,劉子韜接受了新華網採訪。
大語言模型的各方面能力都非常強,把人工智能推向了一個新的發展階段,把大語言模型應用在教育場景中,是非常前沿且熱門的領域。
新華網:您的研究為何聚焦大語言模型在數學領域的前瞻問題與挑戰?
劉子韜:我們主要想研究的是將大語言模型和教育相結合。在教育領域,數學是比較難的學科,從學科的角度上大家都想用AI去解決一些複雜的推理和數學問題,但一直難以突破。大語言模型應用以後,給解決複雜的數學問題給予了一些希望,所以我們在這個熱點下,選擇了更突出的數學學科。
大語言模型是在海量的高質量文本上進行學習,且具有超大規模參數的模型,可以認為它是一個“見多識廣”的超強大腦。
新華網:大語言模型讓更多人看到了人工智能未來的方向,請您介紹一下大語言模型是什麼,它在自然語言處理領域有着怎樣的重要意義?
劉子韜:大語言模型可以做出很多常識性的回答,具有初步的思維推理能力,可以對事物做出判斷、想象、分辨。大語言模型的核心是在海量數據上訓練,並且不是基於某一個具體任務來訓練的大模型。自然語言理解的模型都是各個任務非常獨立的小模型,假如進行一個多輪對話,這個多輪對話是一個任務,但其實背後是有很多個小模型,然後通過模塊拼接的方式組合起來。大語言模型産生之後,因為模型足夠大,有能力覆蓋各個小模型的模塊,就展示出更優秀的反應效果。
我們想探究的是大語言模型的數學推理能力。
新華網:數學一直被視為人工智能的試金石。在解決數學問題中,大語言模型是如何解決複雜的數學問題的?
劉子韜:大型語言模型通過學習大量的文本數據,包括數學教材、教程、論文和問題解答等,來理解和生成數學相關的文本。它們並不直接理解數學的本質,而是學習如何模仿人類解決數學問題的方式。訓練大模型如何解決數學題,分為兩個層面。第一步是需要先給他提供很多的數學相關的數據,但這些數據並不一定都是數學題,有可能是論文、代碼、科學文獻、科學報道等。第二步我希望大語言模型在數學上有突破,就需要提供純數學相關的公式、數據、內容。通過這兩步讓它在數學的解題推理上有一個提升。對於一些簡單的數學問題,如基礎的四則運算、開根號等,模型可以直接生成正確答案。這是因為在訓練數據中,這些類型的問題及其解答很常見,模型已經學習到了如何解決它們。對於更複雜的數學問題,模型可能會嘗試生成一種解決問題的方法或策略,這通常涉及到對問題的重新表述、將問題分解為更小的子問題、應用數學公式或理論等。然而,由於模型並不真正理解數學,它可能會生成不準確或無意義的解答。在這些情況下,人類的指導和監督是必要的。同時,也有學者在嘗試把大語言模型應用在數學領域的定理證明上,有很多學者在研究上需要證明定理的時候,可能需要一定量的定理來證明和支撐新提出的定理,但是每個人都不可能知道世界上所有的定理,這個時候大語言模型就會幫你找到它認為和新定理相關的,你可能需要用的其他定理。
期待形成合力,做一些高質量數據的匯集,推進這項工作。
新華網:大語言模型發展過程中還存在哪些挑戰和機遇?如何面對?
劉子韜:目前的挑戰分為兩個層面,一方面是從技術層面如何提升大語言模型的數學推理能力。相當於它是一個曲線,一開始可能上升的比較快,然後進入平緩期,我們目前還處於上升階段,提升空間非常大。所以我覺得它既是機遇又是挑戰,明明有很大的上升空間,但它確實很難提升。另一方面從應用層面來講,大語言模型讓人看到教育的另外一種可能,有很多其他領域的專家都在關注,它對教育的影響和變革非常多。面對挑戰,我認為首先在探索階段要持續投入的去研究,目前國內的研究團隊還是比較分散的,並沒有形成非常大的&&和基礎設施。另外就是數據方面,我們需要讓大語言模型“見多識廣”,讓它匯聚各種各樣的高質量的知識。
CNCC已20載,尚有非常多的潛力和未來亟待去挖掘。
新華網:2023CNCC恰逢20周年,您對本次大會有什麼寄語?對人工智能的未來有哪些展望?
劉子韜:CNCC是一個讓各方學者匯聚一堂進行交流的非常好的&&,在20年之際迎來新的階段,我希望能夠通過這個大會,未來能夠不斷的引領計算機的發展,促進各個領域行業的人才交流。
我們進入了新一代人工智能技術高速發展的時代,深刻感受到不斷進化的人工智能技術帶來的不斷提升的用戶體驗。未來孕育着巨大的創新機遇,有非常多的機會值得去嘗試研究。