近日,工信部直屬科研事業單位中國工業互聯網研究院發布《人工智能大模型工業應用能力測評報告》。報告顯示,由北電數智自主研發的“驕陽・工業大模型”在核心工業場景能力評測中表現突出,尤其在工具調用、多步推理、工業標準問答、産品客服四項關鍵評測維度,均位列參評國産大模型前列。

本次評測由我國工業互聯網領域核心研究機構——中國工業互聯網研究院組織開展,旨在系統、全面、科學地評估國內外主流大模型在工業領域的應用性能,全面反映模型在工業場景落地時的綜合能力水平,為工業大模型的選型與應用提供可靠依據。
為了有效指引人工智能在工業領域的落地發展,本次測評重點推出工業領域智能體能力評測專項。“驕陽·工業大模型”在國産大模型陣營中脫穎而出,在四大評測項中斬獲兩項第一、一項第二的成績:在智能體工具調用能力測試中,“驕陽·工業大模型”綜合排名位列國産大模型第一,在工具選擇與參數匹配等細分能力上表現突出,標誌着模型具備強大的自主或半自主執行任務能力,可通過與多系統交互,優化或輔助複雜工業流程落地,為工業場景自動化運營奠定基礎;在智能體多步推理能力測試中,“驕陽·工業大模型”展現了出色的記憶管理、任務多步執行與錯誤檢測能力。在實際工業環境中,模型在處理類似設備故障診斷、工藝參數優化等複雜的工業任務流程時,能夠準確調用歷史信息與中間結果,減少人工干預成本,實現更高效、精準的工業化運營與流程優化;在智能體自主規劃能力測試中,“驕陽·工業大模型”的表現位居國産大模型前列。在任務分解、約束識別與動態校準三項細分能力上具有突出優勢,這讓模型能夠根據不同條件,實時優化生産排程、資源調度等多約束複雜任務;同時,出色的自主規劃能力也讓模型能夠將長流程目標系統拆解為可執行步驟,從而提升智能排産、工藝優化等工業場景下決策的可靠性與敏捷性。
除在智能體能力評測表現亮眼外,在工業場景能力測試專項中,“驕陽·工業大模型”同樣斬獲佳績,在三大評測子項中摘得兩項桂冠:
在工業標準問答測試中,“驕陽·工業大模型”在適用範圍判斷、專業術語理解、規則查詢與定位等細分維度上優勢明顯,這意味着在實際工業環境中,模型可針對工藝手冊、設備運維指南、安全規範等工業文檔,精準定位問題核心內容,為工人快速提供準確的標準條款解讀,從而為工業生産中的技術決策、流程優化提供精準信息支撐,提升研發與生産的合規性效率。

在産品客服能力評測中,“驕陽·工業大模型”在産品功能參數理解、對抗性問答等維度表現突出,這證明了模型能夠提供穩定、專業、安全的應答能力。可幫助企業建立全天候、不間斷的響應體系,提升客服響應的專業性與熟練度,優化服務效率與質量,進而顯著提升用戶滿意度。

作為北電數智面向泛工業場景自主研發的大模型,“驕陽·工業大模型”此前已經在國內權威評測機構SuperCLUE發布的專項工業大模型榜單(SC-Industry)中,以總分第一的成績登頂。模型現已在裝備製造、醫療器械、家紡印刷等領域部署應用,並取得多項標杆成果。此次再度取得國産大模型最佳表現,充分印證了北電數智正在通過“技術創新+産業落地”雙輪驅動,加速將工業大模型轉化為驅動製造業提質增效的核心生産力。
未來,北電數智將繼續深化“AI+工業”融合創新,持續優化“驕陽·工業大模型”在更多複雜場景下的表現,為中國工業高質量發展注入更多動能。

