以優質語言數據滋養清朗網絡空間-新華網

近日，中央網信辦印發通知，在全國範圍內部署開展“清朗·整治惡意挑動負面情緒問題”專項行動，聚焦社交、短視頻、直播等&&，全面排查話題、榜單、推薦、彈幕、評論等重點環節，營造更加文明理性的網絡環境。治理焦點從側重語言文字的規範使用，轉向關注凈化語言數據環境，從根本上重塑網絡空間的價值觀生態。

網絡空間是公眾尤其是青少年獲取信息、形成認知的重要場域，其語言環境會直接影響社會精神風貌。在當前的輿論場中，不乏一些惡意挑動對立、宣揚暴力戾氣的負面信息。這類內容往往借助標籤化的敘事框架，將複雜的社會現實簡化為非黑即白的二元對立，以情緒宣泄擠壓理性對話的空間。以一度流行的“努力無用論”為例，其話語體系通過系統性解構奮鬥價值，將複雜的個體發展問題，簡單歸因於外部環境，再借助熱搜詞、網絡熱梗、表情包和語錄段子等易傳播的形式迅速擴散，讓消極化論調引起跟風效仿，不斷消磨公眾的積極心態。更需警惕的是，這類低質量語言數據正成為訓練新一代人工智能的“原料”，若充斥負面情緒、偏見對立的語言數據被人工智能大量學習，會扭曲其認知模型，使技術發展偏離服務人類的初衷。

因此，我們需着力增強網民對網絡信息的獲取能力、辨別能力和分析能力，避免被群體非理性的情緒所裹挾。同時要意識到治理網絡負面情緒絕非簡單的堵住問題漏洞，而是一場對人工智能進行“價值對齊”的關鍵訓練。凈化網絡環境、積累優質語言數據，本質上是為未來人工智能的健康發展提供優質養分，是構建文明理性網絡環境的基礎性工作。

網絡&&應讓算法推薦機制承載更多社會責任，讓正能量話語表達成為流量主體。在人工智能時代，語言作為一種關鍵的數據資源，其承載的內容深刻影響着國家形象塑造與社會共識凝聚。它不僅傳遞信息，更在無形中定義着我們認知世界的範式與邊界。正因如此，算法作為信息分發的核心機制，其內嵌的文化立場與價值傾向便不容忽視。將主流價值導向前置性地融入算法設計，已不僅是技術優化，更是一種必要的社會責任。這要求算法推薦機制承載更多人文關懷，實現從“流量嚮導”向“價值嚮導”的根本性轉變，優先推薦理性、深度、充滿正能量的內容，提升權威信息與優質內容傳播能見度，並主動打破可能造成認知局限的“信息繭房”。同時，&&也需加強內容審核，提升對隱蔽性偏見、價值觀誘導等內容的識別能力，從源頭降低言語操縱和輿論失控的風險。唯有讓主流價值成為流量分配的尺度，才能為清朗網絡空間提供持續而豐沛的價值滋養。

努力推動優質語言數據與人工智能技術形成良性循環，是構築健康網絡生態的長遠之策。當前，大語言模型正悄然成為塑造網民價值觀、培育文化自信的重要力量。語言是思想的載體，優質的語言數據是人工智能學習的精神食糧。大語言模型汲取了富含正能量的優質語言數據，便能在交互中持續輸出理性、建設性觀點，潛移默化地引導公眾思維。網民在搜索信息、獲取知識時，大語言模型生成的積極內容會自然融入其認知體系，在人機互動中促進理性思考。為此，我們應有意識地系統梳理和整合承載中華優秀傳統文化、時代精神與科學知識的優質內容，形成開放、合規的高質量數據集，訓練更具包容性、更可靠的大語言模型。內嵌健康價值觀的人工智能模型將不僅僅是信息的提供站，更可成為“正能量的放大器”和“極端情緒的化解者”，其輸出的理性內容會持續生成新的優質語言數據，反過來進一步優化大語言模型，形成遞歸效應，使技術進步與人文精神深度融合，讓人工智能成為清朗網絡空間的建設者。

網絡空間是億萬網民的共同精神家園，也是社會理性對話、凝聚廣泛共識的重要&&。營造清朗健康的網絡生態，離不開優質語言數據資源的滋養，更有賴於每一位網民的理性參與、網絡&&的主體責任落實以及政府部門的有效引導與監管。當網民以文明表達守護對話底線，&&以技術創新夯實內容根基，政府以精準治理規劃發展軌道，我們定能匯聚起更強大的合力，將互聯網建設成為匯聚共識、激發共鳴的清朗空間。

（作者：陳麗湘，係教育部語言文字應用研究所副研究員）

【糾錯】【責任編輯:朱家齊】

深度觀察

新華全媒頭條丨新時代中國為世界貢獻發展進步力量