新華網北京2月6日電(趙海軍)通用大模型已成為未來人工智能技術和産業生態的核心。國內大模型企業經歷了從“大煉模型”到“煉大模型”的範式轉變,並在智能體、多模態等模式上持續創新,生態體系日益完善。
當前,模型的訓練推理效率及性能顯著提高。通過優化深度學習框架、迭代專用硬體以及算法創新,不僅大幅縮短了訓練時間,降低了計算資源消耗,還在推理階段提升了運行效率和響應速度。然而,在參數規模不斷擴張的情況下,模型訓練的成本和能源消耗不斷增加也是不爭的事實,這也成為行業前行需要逾越的難關。
中國工程院院士劉韻潔指出,目前大模型多局限於單一地點訓練,面臨電力和算力資源難以承受的問題,而協同訓練可從多地點分佈式開展,既減輕單一地點負擔,又能提高訓練效率,目前已實現分鐘級解決排隊問題,且多個異地訓練效率能達到單點訓練的80%。
2022—2027年中國通用大模型市場規模預測 (資料來源:賽迪四川)
賽迪四川在《2024AI大模型行業調查研究報告》(以下簡稱:《報告》)中分析認為,我國通用大模型市場規模在2022年約為70億元,2023年突破130億元,預計到2027年將突破400億元,年均增速超25%。《報告》指出,隨着未來産業基礎建設持續 增長、大模型應用替換、生成式人工智能帶來的增量市場和人工智能賦能的企業級應用拓展,通用大模型市場將逐漸成熟。
在通用大模型産業,從企業分類看:百度、阿里、騰訊、華為等科技領軍企業有全面布局能力,領跑市場;科大訊飛、商湯科技等AI垂類企業在模型層和應用層競爭優勢獨特;智譜華章、百川智能、月之暗面等初創企業憑藉技術優勢和創新精神快速興起。
從産業鏈看,通用大模型包括基礎層、工具/&&層和模型層。基礎層提供基礎設施與技術支持;工具/&&層匯聚相關企業,提供模型開發與應用工具;模型層匯聚研發及應用企業。該模型已成為人工智能應用創新的重要驅動力,在自然語言處理、計算機視覺和語音識別等領域取得突破進展。
從應用生態看,越發豐富多元,涉及教育、醫療健康、金融科技等諸多領域,催生出大量大模型業務應用場景。開源與閉源模式在模型開發與應用中互補共生,降低開發者入門門檻,加速新技術普及,且能提供更專業、穩定的服務。
通用大模型的商業模式正在漸趨形成,從路徑來看,當前主要還是“通用大模型+行業定制模型”。具有數據、算力和算法綜合優勢的企業將模型整合為基座大模型,通過低門檻、高效率的大模型開發與部署&&,向各行各業提供大模型服務。主要盈利方式包括交易量收費、定制開發費用、數據服務費用和訂閱收費等。
通用大模型在落地中存在諸多痛點,如數據安全與隱私保護、成本與效益平衡、內容可信度與質量可控以及技術創新與社會責任平衡等。解決這些痛點,建議政府相關部門完善頂層設計,規範數據標準,健全監管體系;企業要和科研機構合作,以應用為導向強化具體場景應用,樹立長遠投資視角,健全風險管理體系;用戶要根據需求選産品,注意數據安全,向開發者反饋,共同推動通用大模型技術發展。
未來,通用大模型將呈現出大小模型並行、融合多模態數據、端雲協同和算網協同等發展趨勢,能兼顧規模與效率、提供更豐富信息、實現任務均衡分配和資源優化調配。
通用大模型市場前景廣闊,行業盈利空間較大,但盈利能力尚待提升。隨着技術的不斷成熟和應用場景的拓展,相信大模型將在更多垂直領域實現深度應用,撬動各行各業的智能化轉型。