7月2日至5日,2025全球數字經濟大會在京召開。首都信息發展股份有限公司數據總監崔曉峰在接受專訪時&&,推動數據要素與AI共生需聚焦三大核心,即構建全國互聯互通的數據流通基礎設施,打造基於數字合約和管理共識機制的可信數據空間以保障安全流通,建設面向人工智能的高質量數據集。目前首信已在金融、醫療領域實現“可用不可見”的敏感數據應用試點,並通過在線協作&&促進生態共建。
新華網:首信在本屆大會上重點關注哪些與數據要素、AI+相關的議題?
崔曉峰:我們主要關心三個方面的議題:第一個是數據流通基礎設施的建設,這是整個數據要素的基礎;第二方面就是關於可信數據空間的建設,包括行業可信數據空間以及企業可信數據空間的建設;第三個議題就是關於高質量數據集的建設,助力AI的發展。AI發展到哪個領域,高質量數據的建設就到哪去,所以高質量數據質量和AI其實是相輔相成的,是一個互相促進的過程。
新華網:您對大會在推動數據基礎制度建設方面有何期待?
崔曉峰:第一是,希望大家在基礎設施建設上形成一些共識,包括業務節點和區域功能節點的互聯,全國的跨域跨鏈的互聯互通,形成真正“立足北京,面向全國“的數據基礎設施;第二是,期待各行各業能夠把自己所擁有的高價值、高質量的數據集,在基礎設施上流通起來,形成活躍的市場主體;第三是,希望生態企業能夠加入進來,包括數據集的供方、需方、數據開發方、模型開發者、增值服務的提供方等,共同建設繁榮的生態。
新華網:行業高質量數據集建設面臨哪些挑戰?首信有哪些實踐經驗?
崔曉峰:高質量數據建設是個系統工程,面臨的挑戰包括:首先是頂層設計的缺失,導致數據資源體系建設碎片其次是行業標準的缺失,阻礙數據的流通和交互;第三是海量數據場景下的性能、安全與併發問題。我們的實踐包括:首先對數據資源體系頂層規劃設計,明確數據從採集到應用的全生命周期路徑;其次建立端到端的數據標準體系,覆蓋數據分類分級、質量評估等關鍵環節;最後通過AI驅動的數據治理能力和分佈式處理架構,解決高頻場景下的數據治理難題,形成從數據供給到需求的閉環管理。
新華網:行業可信數據空間落地存在哪些難點?首信如何解決?
崔曉峰:核心挑戰在於兩個方面:一是數據安全交互機制,需要保障數據按照數字合約進行流通和交付;二是生態共創環境建設,需要支持多方在線協作開發。我們的解決方案是:通過數字合約技術實現數據安全交付,配套建立管理共識機制,形成技術可信與管理可信的雙重保障;同時構建在線協作&&,提供數據標注、數據開發、模型開發、訓練、驗證的全流程環境,並深度融入行業業務知識,確保數據價值在垂直場景中落地。目前已在金融、醫療、數字文化等多個領域完成試點,實現敏感數據“供得出、流得動、保安全”。

