AI“向真”須嚴防數據“投毒”
2025-09-29 15:52:52
來源:
瞭望 2025年第39期
文 | 張翊飛
AI搜索具備智能篩選、主動生成等特徵,正在深刻改變人類信息獲取方式。然而,近期一種名為“生成式引擎優化”(GEO)的操作手法,正悄然演變為數據“投毒”行為:部分服務商將定制內容或偽造的權威信息大量投放到AI頻繁抓取的高權重平台;更有甚者在代碼中植入隱藏指令,干擾AI判斷,使其輸出帶有特定傾向性的內容。
數據“投毒”危害不容小覷。其一,破壞信息公平。被污染的AI放大虛假信息,使優質內容湮沒於“數據垃圾”中,形成“劣幣驅逐良幣”。其二,損害用戶權益。用戶在非客觀真實信息的影響下可能會做出錯誤決策,尤其在金融、醫療等低容錯率場景中,可能引發財産損失或人身安全風險。其三,阻礙産業健康發展。錯誤信息在AI模型中被反復引用,長此以往,用戶對AI的信任將受到侵蝕,AI産業的創新進程與發展質量也將受到重挫。
防範數據污染、確保AI信息真實可靠,必須加快構建多方協同的治理體系。
政府部門應加強監管引領,盡快制定GEO相關行業規範標準,明確數據來源審核、質量評估及內容真實性驗證等要求;同時,要提高違法成本,對非法數據交易與惡意“投毒”行為實施嚴厲打擊。模型企業須強化技術自律,加強對訓練數據的全流程篩查,持續提升數據清洗與異常檢測能力,重點研發高精度“毒數據”識別與過濾技術,築牢數據真實性與可靠性的內部防線。對公眾而言,也需提高對AI技術的認知水平和對虛假信息的辨別能力,並主動反饋AI異常輸出,為構建開放健康的AI治理生態貢獻力量。
“AI向善”,必先“向真”。AI發展以數據為基,只有保證數據真實乾淨,AI發展才能行穩致遠,造福於人。□