10月15日,由中國電子信息行業聯合會主辦的第27屆中國國際軟體博覽會在鄭州舉辦。百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜分享了大模型時代AI基礎&&驅動軟體生態帶來的新變化。她&&,大模型的爆發將人工智能推向一個新的高潮。
百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜
在開幕式暨主題峰會環節,吳甜&&,大模型具有效果好、泛化性強、研發流程標準化等特點,正引領人工智能的發展。在這一階段,AI研發範式帶來了開發、計算、部署的新挑戰,尤其是大模型的高效訓練和推理部署,需要軟硬體協同發力。
她進一步講到,大模型高效訓練的關鍵要素包括訓練吞吐、訓練有效時間和收斂效率,這背後涉及框架、芯片、集群、算法等軟硬體不同組合的協同優化。對大模型的推理部署來説,效果無損、低時延高吞吐、成本效益等要素極為關鍵,需要模型壓縮與量化、並行推理、軟硬體協同優化等技術的支持。
要解決大模型研發所帶來的一系列挑戰,深度學習&&關鍵需要具備大規模並行計算、高性能推理部署、全流程工程化三方面能力。以百度飛槳為例,作為百度自研的産業級深度學習開源開放&&,飛槳從核心框架、基礎模型庫,到端到端開發套件、工具與組件,以及星河社區等,全方位支持了文心大模型的演進過程。飛槳在核心框架和芯片之間構建了硬體適配層,打造多硬體統一適配方案,已適配60多款系列芯片,相比PyTorch,芯片基礎適配的接口數減少56%,代碼量減少80%。
在深度學習&&與大模型聯合優化下,文心大模型的能力得到了拓展、效率得到了提升,ERNIE-4.5-300B-A47B模型上實現預訓練MFU達47%, ERNIE-4.5-300B-A47B模型在TPOT 50ms時延條件下,實現了輸入57K tokens/秒、輸出29K tokens/秒的高吞吐性能。文心思考模型X1.1相比上個版本,事實性提升34.8%,指令遵循提升12.5%,智能體提升9.6%。
大模型與深度學習&&為科技創新和産業升級構築了堅實的AI基礎技術底座&&,但最終在各行各業廣泛應用起來,應用生態建設至關重要。
百度進行了模型及相應配套工具的開源。文心大模型4.5系列已開源11款模型,涵蓋47B、3B激活參數的混合專家(MoE)模型,與0.3B參數的稠密型模型,配套開源了文心大模型開發套件ERNIEKit、大模型高效部署套件FastDeploy,方便開發者在此基礎上實現高效的模型開發和部署,進而在更廣泛的行業加速AI的落地應用。
星河社區為開發者提供全方位服務,已上線700萬個實踐項目,600多門公開課以及400多場AI競賽。開發者也在應用中反過來推動AI基礎技術&&的完善。目前,飛槳框架貢獻者俱樂部成員達到195位,飛槳開發者技術專家411位,全球各地開發者自主建立運營的飛槳領航團超過400個。
在文心大模型和飛槳深度學習&&的基礎上,百度在上海、廣州、武漢、南京、寧波、廈門、南昌、無錫等多地落地産業賦能中心、數據生態中心和教育創新中心,加快區域産業智能化升級。例如,在製造行業,中車集團依託百度飛槳産業級深度學習&&以及飛槳科學計算 PaddleCFD 套件,創新性地構建了空氣動力學智能化倣真大模型,整體倣真效率提升30倍以上。在能源行業,國家電網聯合百度打造的人工智能基礎設施,讓安全巡檢效率提升了36倍。在通信行業,中國聯通推出的智能中心AI&&,助力1.3萬座基站安全作業。
公開資料顯示,截至2025年9月,飛槳文心生態開發者已達到2333萬,服務企業達到76萬家。