以優質語言數據滋養清朗網絡空間-新華網
新華網 > > 正文
2025 10/24 08:41:33
來源:光明日報

以優質語言數據滋養清朗網絡空間

字體:

  近日,中央網信辦印發通知,在全國範圍內部署開展“清朗·整治惡意挑動負面情緒問題”專項行動,聚焦社交、短視頻、直播等&&,全面排查話題、榜單、推薦、彈幕、評論等重點環節,營造更加文明理性的網絡環境。治理焦點從側重語言文字的規範使用,轉向關注凈化語言數據環境,從根本上重塑網絡空間的價值觀生態。

  網絡空間是公眾尤其是青少年獲取信息、形成認知的重要場域,其語言環境會直接影響社會精神風貌。在當前的輿論場中,不乏一些惡意挑動對立、宣揚暴力戾氣的負面信息。這類內容往往借助標籤化的敘事框架,將複雜的社會現實簡化為非黑即白的二元對立,以情緒宣泄擠壓理性對話的空間。以一度流行的“努力無用論”為例,其話語體系通過系統性解構奮鬥價值,將複雜的個體發展問題,簡單歸因於外部環境,再借助熱搜詞、網絡熱梗、表情包和語錄段子等易傳播的形式迅速擴散,讓消極化論調引起跟風效仿,不斷消磨公眾的積極心態。更需警惕的是,這類低質量語言數據正成為訓練新一代人工智能的“原料”,若充斥負面情緒、偏見對立的語言數據被人工智能大量學習,會扭曲其認知模型,使技術發展偏離服務人類的初衷。

  因此,我們需着力增強網民對網絡信息的獲取能力、辨別能力和分析能力,避免被群體非理性的情緒所裹挾。同時要意識到治理網絡負面情緒絕非簡單的堵住問題漏洞,而是一場對人工智能進行“價值對齊”的關鍵訓練。凈化網絡環境、積累優質語言數據,本質上是為未來人工智能的健康發展提供優質養分,是構建文明理性網絡環境的基礎性工作。

  網絡&&應讓算法推薦機制承載更多社會責任,讓正能量話語表達成為流量主體。在人工智能時代,語言作為一種關鍵的數據資源,其承載的內容深刻影響着國家形象塑造與社會共識凝聚。它不僅傳遞信息,更在無形中定義着我們認知世界的範式與邊界。正因如此,算法作為信息分發的核心機制,其內嵌的文化立場與價值傾向便不容忽視。將主流價值導向前置性地融入算法設計,已不僅是技術優化,更是一種必要的社會責任。這要求算法推薦機制承載更多人文關懷,實現從“流量嚮導”向“價值嚮導”的根本性轉變,優先推薦理性、深度、充滿正能量的內容,提升權威信息與優質內容傳播能見度,並主動打破可能造成認知局限的“信息繭房”。同時,&&也需加強內容審核,提升對隱蔽性偏見、價值觀誘導等內容的識別能力,從源頭降低言語操縱和輿論失控的風險。唯有讓主流價值成為流量分配的尺度,才能為清朗網絡空間提供持續而豐沛的價值滋養。

  努力推動優質語言數據與人工智能技術形成良性循環,是構築健康網絡生態的長遠之策。當前,大語言模型正悄然成為塑造網民價值觀、培育文化自信的重要力量。語言是思想的載體,優質的語言數據是人工智能學習的精神食糧。大語言模型汲取了富含正能量的優質語言數據,便能在交互中持續輸出理性、建設性觀點,潛移默化地引導公眾思維。網民在搜索信息、獲取知識時,大語言模型生成的積極內容會自然融入其認知體系,在人機互動中促進理性思考。為此,我們應有意識地系統梳理和整合承載中華優秀傳統文化、時代精神與科學知識的優質內容,形成開放、合規的高質量數據集,訓練更具包容性、更可靠的大語言模型。內嵌健康價值觀的人工智能模型將不僅僅是信息的提供站,更可成為“正能量的放大器”和“極端情緒的化解者”,其輸出的理性內容會持續生成新的優質語言數據,反過來進一步優化大語言模型,形成遞歸效應,使技術進步與人文精神深度融合,讓人工智能成為清朗網絡空間的建設者。

  網絡空間是億萬網民的共同精神家園,也是社會理性對話、凝聚廣泛共識的重要&&。營造清朗健康的網絡生態,離不開優質語言數據資源的滋養,更有賴於每一位網民的理性參與、網絡&&的主體責任落實以及政府部門的有效引導與監管。當網民以文明表達守護對話底線,&&以技術創新夯實內容根基,政府以精準治理規劃發展軌道,我們定能匯聚起更強大的合力,將互聯網建設成為匯聚共識、激發共鳴的清朗空間。

  (作者:陳麗湘,係教育部語言文字應用研究所副研究員)

【糾錯】 【責任編輯:朱家齊】