網絡“大數據”,不只“數據大”-新華網
新華網 > > 正文
2024 01/29 07:53:30
來源:人民日報海外版

網絡“大數據”,不只“數據大”

字體:

  在重慶市人力社保政務服務中心,工作人員在介紹人力資源大數據信息庫。  新華社記者 唐 奕攝

  貴州省貴陽市2023中國國際大數據産業博覽會展館現場。

  何曉璇攝(人民視覺)

  在各類網絡&&上,“算法”成為一項廣泛應用的技術。通過數據分析和精準推薦,它改變了過去“人找信息”的搜索模式,逐步實現“信息找人”。

  關於“算法”,人們觀點不一。有人認為,它方便了用戶,提供了更精準的網絡服務;有人認為,它在“算計”用戶,造成“信息偏食”等問題;還有人認為,作為一項技術,它並無好壞之分,關鍵在於如何用正確價值和規範去駕馭。

  自今日起,本版推出“透視‘算法’”系列報道,解讀“算法”帶來的變化與影響。系列報道第一篇,關注大數據時代網民獲取信息習慣的變遷。

  現狀

  內容更豐富,&&更多元

  “以前遇到問題,第一反應是打開瀏覽器搜一下。現在除了搜索網頁,也會去微信或短視頻&&找答案。”北京市民王瑛向記者展示了一段短視頻:“你看,前兩天下廚,想做一道魚香肉絲,抖音一找,教學視頻就出來了。”

  王瑛今年36歲,從2000年左右開始接觸互聯網。最初10多年,她獲取信息的方式主要有兩種,一是在搜索引擎上檢索,二是瀏覽門戶網站。但最近幾年,這種習慣開始改變。“現在網上信息太多,讓人眼花繚亂,甄別起來比較費力。有時需要特定信息時,在手機軟體中更容易找到結果。”她邊介紹,邊打開手機界面:“比如,想找購物信息,就去淘寶逛逛;想看電影,就去貓眼找找;想了解明星動態,就去微博看看;想獲取專業知識,就去知乎搜搜……”

  在王瑛看來,這種改變是不知不覺形成的。每天頻繁使用各類手機軟體,“順手搜一下”並不費力。久而久之,就形成了用多個&&搜索信息的習慣。最重要的是,“搜”完之後,手機應用會記住自己的需求,主動推薦感興趣的信息,省時省力。

  王瑛的用網經歷具有一定代表性。記者針對120名用戶的搜索行為作了一項小型調研,結果顯示:所有人均有使用搜索引擎的習慣,但將其作為唯一選擇的僅佔15%。多數人&&,自己會在各類手機應用中檢索信息,並時常瀏覽各&&推薦的信息。比如,獲取生活經驗類信息,很多人都會選擇刷短視頻,“遇事不決,視頻來學”。

  行業數據也印證了這一點。截至2023年6月,中國搜索引擎用戶規模已達8.41億人。但近七成用戶也會通過短視頻完成搜索,微信“搜一搜”月活躍用戶也已超過8億,幾乎與搜索引擎用戶總量相當。另一項調查也顯示,用戶平均每天會在 3.8個&&上搜索信息。

  挑戰

  信息雜蕪與“&&壁壘”

  雖然網上信息量更大了,獲取信息的渠道更多了,但不少用戶仍&&“存在使用體驗不佳的情況”。

  信息雜蕪是原因之一。“現在網上營銷信息較多,雖然大多標注了‘廣告’字樣,但畢竟需要甄別,影響使用效率。”王輝是一名金融分析師,經常需要在網上檢索信息,且對信息質量要求較高。但他發現,現在找到一張“純凈的網頁”非常困難,這在一定程度上拖慢了他的工作節奏。

  王輝的情況並非個例。記者調查發現,在網上檢索信息時,顯示結果中很多都是廣告鏈結。比如,搜索“培訓”二字,排名最靠前的兩個結果均為商業培訓機構廣告。

  據了解,各大搜索網站也都注意到這個問題,但如何改變行之有年的商業模式,還是個尚待破解的命題。“廣告是網站主要盈利來源,目前業界只能盡量優化廣告信息,提升用戶體驗,但要徹底轉型,還需一定時間探索。”一家互聯網公司的銷售經理告訴記者。

  除了信息雜蕪,互聯網界還不同程度存在“&&壁壘”現象。

  據了解,過去,綜合類搜索網站是各類網絡&&獲取流量的主要入口,通過一個搜索框、一個關鍵詞,用戶可以搜到全網各個&&的信息。而隨着移動互聯時代來臨,美食、家居、旅游、短視頻等垂直&&用戶規模越來越大,每個&&都形成了自己獨有的“大數據庫”,這個“大數據庫”不僅包含海量優質信息,還囊括了用戶使用習慣等數據。動輒坐擁上億用戶的網絡&&不再需要其他&&“引流”,這些數據便被視為獨家資源,不再對外開放。這導致用戶很難通過綜合類&&搜到所有需要的信息。

  趨勢

  向智能化與精準化發展

  如今,中國已經成為數據量最大、數據類型最豐富的國家之一。國家數據局日前發布的信息顯示:我國數據産量已佔全球數據總量的10.5%。更有研究機構預測,到2025年,中國數據總量或佔全球近30%。

  “數據作為新型生産要素,已快速融入生産、分配、流通、消費和社會服務管理等各環節,但目前在發展過程中也存在數據應用潛力釋放不夠、數據供給質量不高、流通機制不暢等問題。”國家數據局副局長沈竹林&&。

  在這一背景下,僅僅“數據大”已經無法滿足社會需要,還要進一步實現“數據精”“數據準”,從而有效降低用戶獲取信息成本,提供更加個性化、精細化的內容服務。在這種需求驅動下,“算法”技術應運而生。

  “算法”是人工智能技術與大數據技術的關聯節點。中國科學院科技戰略諮詢研究院院長潘教峰認為,人工智能正在科研、貿易、交通、醫療等諸多場景中改變人們溝通的方式。其“活字典”、移動的“大百科全書”的特性,加上越來越接近人類水平的語言理解和生産能力,讓其“答覆”既有常識性,又呈現出集成創新性。

  因此,在互聯網海量數據基礎上,“算法”可以通過人工智能技術對用戶興趣偏好和需求進行分析歸納,描繪出用戶畫像,打上特性“標籤”,進而以此為依據,進行精準化、個性化的定制推薦。

  在“算法”技術的調配下,用戶每次打開手機應用,都可以收到針對個人需求的信息推送。同時,&&通過不間斷收集信息,會變得越來越“懂”用戶——打開購物網站,近期想要購買的産品已被推薦到首頁;進入短視頻&&,接踵而至的都是自己喜歡的視頻內容;瀏覽旅游軟體,想去的地方一一列在眼前,連機票購買鏈結都放好了……這一切,正是憑藉日漸成熟的算法技術才得以實現。

  然而,有人擔心,“算法”在大數據時代精準調配網絡信息、提升服務水準的同時,也帶來了“信息偏食”、網絡沉迷、數據洩露、技術濫用等隱患。這些問題多大程度存在?又有哪些破解之道?我們將在“透視‘算法’”系列報道第二篇進行解讀,請大家持續關注。(記者 盧澤華)

【糾錯】 【責任編輯:冉曉寧】