新華網上海11月29日電(記者潘清)伴隨人工智能大潮愈演愈烈,數據集作為大模型訓練、推理和驗證關鍵基礎的重要性日益凸顯。近日在上海舉行的“2025全球數商大會”上,“AI核心數據集生態聯盟”正式成立。
“全鏈路數據治理賦能高質量數據集建設”主題論壇26日舉行。此次論壇由領先的企業級AI數智基座平台提供商普元信息技術股份有限公司與中國信息通信研究院華東分院聯合主辦,邀請政、産、學、研、用各領域專家解構頂層設計、探究技術基石。
今年9月,中國信息通信研究院人工智能研究所聯合清華大學計算社會科學與國家治理實驗室、中國人工智能産業發展聯盟數據委員會發布了《人工智能高質量數據集建設指南》。論壇上,中國信通院人工智能研究所平台與工程化部副主任、中國人工智能産業發展聯盟數據委員會主任李蓀對這一行業指導文件進行了解讀,並&&其&&旨在為人工智能領域高質量數據集建設提供實踐參考。
針對企業結構化、非結構化、半結構化數據混雜的情況,普元信息技術領軍人焦烈焱&&,數據治理不再只是簡單清洗數據的IT項目,而是一項知識工程工作,需要把存有散亂數據“原礦”的混沌數據集,通過主數據等減熵方式變成知識工程的基礎資産,系統性地“煉製”知識放到數據集中,從而形成能夠驅動AI、賦能決策的高質量數據集。

焦烈焱&&,高質量數據集的構建是一項系統工程,而普元的核心優勢正是提供“全鏈路”治理能力,從戰略諮詢、平台工具到數據開發治理運營一體化。
論壇現場,普元發布“易數”AI原生數據資産平台最新版本。産品深度融合AI能力支持雙向賦能的智能飛輪建設,可以通過智能化數據發現、自動化數據治理、一體化數據服務,幫助企業構建AI的數據工廠,提供敏捷的數據洞察,大幅提升構建和管理高質量數據集的效率。
普元信息數據産品線總經理李書超透露,普元“易數”還將通過三層能力支撐企業數據智能體的進化:數據進項,將企業所有業務都以數字化方式呈現;增強決策,通過數據構建預測,支持對未來的業務分析與決策判斷;自主智能,融合平台和AI能力推進數字員工、智能網絡、知識學習、自進化升級等。
着眼推動産業協同,普元信息在論壇上宣布成立“AI核心數據集生態聯盟”,聯合産、學、研、用多方力量共同制定高標準的數據規範,以聯盟力量攻克高質量數據集建設的共性難題,並促進高質量數據集的流通與共享。
同步啟動的“燈塔計劃”,旨在深度挖掘能源、製造、金融等垂直領域的數字化轉型標杆案例,總結成功經驗,為全行業的數據治理提供可複製、可推廣的實踐範本。
與會專家紛紛&&,高質量數據集成為AI時代的競爭關鍵,而從戰略諮詢、平台工具到落地運營的全鏈路數據治理,是實現競爭力提升目標的重要路徑。

