今年以來,國內外科技企業競相圍繞大模型擴展商業版圖。據統計,截至今年7月底,我國累計有130個大模型問世,其中,僅今年前7個月就有64個大模型發布。國産大模型進入高速發展期,加速千行百業的數字化與智能化轉型。
賦能場景應用
正在進行的杭州亞運會是史上首屆雲上亞運,基於阿里雲實現核心系統百分百上雲。在杭州亞運會數字科技體驗中心,游客借助藝術裝置“暢想未來亞運”,就能讓阿里雲的繪畫創作大模型“通義萬相”現場繪畫,生成亞運主題圖像。
“阿里雲是最早投入大模型研發的科技公司之一,2019年開始布局大模型。”阿里雲CTO周靖人告訴記者,今年以來,阿里雲連續推出多個自研通義大模型和大模型應用産品,已具備處理或生成文本、語音和圖片等多種模態內容的能力,並在各行各業廣泛應用。
9月21日,華為雲在華為全聯接大會2023上發布盤古醫學大模型。該模型具備醫學臨床輔助能力,將有效支撐醫學檢驗、臨床輔助診療、個人健康管理等場景應用。華為常務董事、華為雲CEO張平安介紹,基於盤古大模型研發的潤達醫療大模型·良醫小慧,將走進4000家醫院,輔助醫生進行報告解讀和診斷。
9月5日,2023百度雲智大會宣布,百度智能雲千帆大模型&&上,月活企業數已近萬家,覆蓋金融、製造、能源、政務、交通等行業的400多個場景。
中國移動研究院主任研究員黃實介紹,中國移動已發布“九天·海算政務大模型”和“九天·客服大模型”兩個行業大模型,正與市場需求方在政務、醫療、司法、教育等領域持續展開深入合作,共同推進大模型技術在實際場景中的應用。
技術挑戰待解
大模型重塑千行百業的背後,是眾多複雜的技術挑戰。
“伴隨着參數和數據的提升,大模型對算力的要求也不斷提高,提供算力的GPU芯片已供不應求。”黃實建議,下一步,要打造以算力網絡為核心的新型基礎設施,以網強算,緩解算力供給不足。“要通過算力網絡連接泛在化的算力資源,利用網絡集群優勢,突破單點算力的性能極限;通過整網資源的最優化配置和使用,緩解算力不足的問題。”
“找到合適的落地場景是大模型遇到的最大挑戰。”百度智能雲AI與大數據&&總經理忻舟&&,百度目前研究了400多個場景,每個場景對大模型的使用方法、行業經驗都不同。在部分標杆行業場景,百度的算法專家會針對不同客戶、不同需求總結共性特徵,不斷沉澱經驗、積累工具、完善工具鏈。
華為雲CTO張宇昕認為,隨着大模型能力的涌現,模型參數將很快達數萬億,對海量的穩定算力、大規模並行訓練以及整體的架構設計都提出了更高要求。同時,隨着數據集規模的快速增長,數據高效存儲、清洗和標注的難度等問題仍有待優化。
共建開源生態
人工智能引發生産生活方式、社會治理模式、科學研究範式的變革,為經濟社會高質量發展提供了新的動力。共建大模型生態,降低使用門檻,是“煉大模型”的科技巨頭們的一致選擇。
“阿里雲希望和全行業共建大模型開源生態,進一步降低大模型使用門檻。”周靖人介紹,阿里雲一方面自研了通義大模型系列,另一方面也在為大模型創業公司和開發者提供服務,推動大模型生態繁榮。阿里雲魔搭社區是大模型開源社區,目前已集聚了230多萬人工智能開發者、1200多個優質人工智能模型,模型累計下載總量超過8500萬。
清華大學黨委書記邱勇&&,要瞄準世界科技前沿和國家重大戰略需求推進科研創新;加強人工智能方向拔尖創新人才自主培養,為關鍵核心技術攻關提供人才支撐;服務人工智能領域創新鏈産業鏈深度融合,提升教育對高質量發展的支撐力貢獻力。
護航大模型發展,還需做好頂層設計,築牢安全防線。科技部部長王志剛&&,要搶抓新一輪人工智能發展的重大機遇,堅持系統思維,把握人工智能發展規律和趨勢,按照強基礎、促發展、保安全的思路,做好頂層設計,以體系化工程思路進行科技攻關,以創新鏈和産業鏈有機融合構建創新生態,以“發展是最大安全”的理念健全治理體系。(記者 佘惠敏)