國家數據局:我國7個數據標注基地已建設數據集524個 服務大模型163個-新華網
新華網 > > 正文
2025 07/29 08:43:42
來源:人民郵電報

國家數據局:我國7個數據標注基地已建設數據集524個 服務大模型163個

字體:

  7月22日,國家數據局舉行2025中國國際大數據産業博覽會新聞發布會。記者從會上獲悉,我國全面加速高質量數據集建設和應用落地,進一步推動數據要素市場化、價值化,為培育新質生産力提供堅實的數據支撐。截至上半年,7個數據標注基地已建設數據集524個,規模超過29PB,服務大模型163個。下一步,國家數據局將多措並舉,進一步優化産業規劃布局,推動數據産業從“單點突破”向“全域發展”轉變。

  國家數據局副局長余英表示,數據,特別是高質量、多模態、精標注的數據對人工智能發展至關重要,在提質賦能中發揮關鍵作用,是人工智能發展的不竭動力。中國在人工智能領域取得的成果與數據工作的創新實踐密不可分。

  余英介紹,高質量數據集是經過採集、加工等數據處理,可以直接用於開發和訓練人工智能模型的數據集,能夠有效地提升模型性能。我們日常生活中把高質量數據集分為三類:第一類是通識類,第二類是行業通識類,第三類是行業專識類。

  余英表示,國家數據局組織開展生態培育專項行動,主要包括三方面內容:一是組織開展高質量數據集典型案例徵集和示範推廣,挖掘醫療、工業、交通等重點領域標杆實踐;二是定期舉辦技術交流活動,圍繞數據標注、合成及高質量數據集建設方法論等開展深度研討;三是搭建常態化供需對接&&,促進數據供給方、技術提供方、場景應用方精準匹配。同時還指導合肥、成都等7個城市建設數據標注基地,先行先試探索數據標注産業發展經驗。

  去年12月,國家數據局會同國家發展改革委、教育部、財政部、金融監管總局、中國證監會等5部門印發《關於促進數據産業高質量發展的指導意見》,聚焦數據産業發展現狀和市場需求,推動培育多元經營主體,營造競爭有序、繁榮活躍的數據産業生態。

  對於數據産業的發展,余英表示,發展數據産業是推進數據要素市場化配置改革、加快構建以數據為關鍵要素的數字經濟的重要舉措,也是發展新質生産力、培育新動能新優勢的必然要求。充分發揮我國規模市場和海量數據雙優勢,大力發展數據産業,培育新的經濟增長點,已成為各方共識和共同期盼。

  余英介紹,近期,各地立足發展基礎,加快謀篇布局,搶抓數據産業發展機遇。上海、河南等地制定&&促進數據産業發展的實施意見或專項政策,山東、山西等地紛紛開展數據企業培育工作,江蘇、浙江等地建立了數據産業發展基金。北京海淀區、杭州高新區、廣東深圳前海等地探索建立面向數據産業的專業服務&&和載體。在各方積極探索下,一大批創新型數據企業競相涌現,數據産業高質量發展的畫卷正徐徐展開。

  接下來,國家數據局將多措並舉,進一步優化産業規劃布局,推動數據産業從“單點突破”向“全域發展”轉變。下半年,還計劃布局建設一批數據産業集聚區試點,支持和引導有條件的地區,立足資源稟賦和産業基礎,打造協同互補、特色鮮明、優勢突出、具有較強競爭力和示範帶動性的數據産業集聚區,發揮産業區域集聚和規模效應,探索多元化數據産業培育發展路徑。

  據悉,由國家數據局主辦、貴州省人民政府承辦的2025中國國際大數據産業博覽會將於8月28日至30日在貴州省貴陽市舉行。本屆數博會將以“數聚産業動能 智 啟發展新篇”為主題,圍繞“數據要素”“數據産業”“數字經濟”“數據基礎設施”“國際合作”5個板塊,舉辦20余場交流活動,分享數據産業前沿理論和創新實踐。 (作者:蘇德悅)

【糾錯】 【責任編輯:朱家齊】