近日,貴陽大數據交易所以全國首個數據要素登記行業節點DOID為載體,上線572個人工智能高質量訓練數據集,首創數據要素行業稀有地圖,為人工智能大模型發展精準賦能。
本次上線的數據集匯聚了豐富數據資源,首批高質量人工智能大模型訓練數據集供給方來自中文在線、中國開放數據、拓爾思、海天瑞聲、曼孚科技、粟特方舟、國信數據等16家企業和機構,涵蓋“數據要素×”金融服務、工業製造、醫療健康、商貿流通等多個重點領域,涉及文字、音頻、圖片、視頻等多種模態,旨在匯聚全面、系統、權威的高質量人工智能大模型訓練數據集,為人工智能大模型廠商提供燃料。
“這次中文在線在貴數所上線的數據集産品包括了中文在線數字圖書館數據集、有聲音頻書數據集、中小學題庫數據集、高校職教題庫數據集、視頻資料數據集等。”北京中文在線閱讀公司執行董事兼總經理杜嘉説,這些數據集對於目前的AI大模型語料訓練、數字圖書館建設、數字教育內容資源建設等可以發揮積極的作用,期待與貴數所協力共贏,共創數據要素新篇章。(記者 方亞麗)