新華網 正文
你擔心的金融安全 無監督機器學習技術可以搞定
2019-03-19 06:59:43 來源: 科技日報
關注新華網
微博
Qzone
評論
圖集

  “無科技,不金融”。隨著移動互聯網時代的到來,科技金融模式不斷創新,但是欺詐手法也在不斷翻新,呈現出專業化、産業化、隱蔽化等特點。日前,世界科技開發者盛會DeveloperWeek 2019評選VR、人工智能、金融科技等領域優勝者,AI公司DataVisor維擇科技憑借無監督機器學習技術獲得最具投資價值的科技金融企業獎。

  無監督機器學習技術是什麼,為何會被認為最具投資價值?它能在科技金融活動中起到什麼作用?能解決哪些金融交易中的問題?

  科技金融反欺詐創新利器

  與傳統金融不同,互聯網金融業務大多發生在線上,往往幾秒鐘就完成審核、申請、放款等,面臨的欺詐風險也是前所未有的。據統計,我國網絡犯罪導致的損失佔GDP0.63%,一年損失金額高達4000多億人民幣。國際上的情況也不樂觀,多份市場研究報告指出,僅2016年一年,全球信用卡、借記卡、預付卡和私有品牌支付卡損失就高達163.1億美元;每年保險欺詐(不包括健康險)損失總額預計超過400億美元。

  “隨著技術不斷演進,針對金融業的攻擊、欺詐手段已不同以往。團夥作案、分工明確、掌握各種先進技術工具、不斷變化攻擊手段,全新挑戰使得金融企業越來越難以招架。”DataVisor中國區總經理吳中説,金融反欺詐期待創新已成業內共識。

  “無監督機器學習是近年才發展起來的反欺詐手法。目前國內反欺詐金融服務主要是應用黑白名單、有監督學習和無監督機器學習的方法來實現。”愛信諾徵信有限公司總經理金端峰在接受科技日報記者專訪時説。

  黑白名單被認為是最原始的反欺詐方式,類似于“篩選器”。如銀行徵信係統就可理解成一個黑白名單,信用卡多次逾期還款就可能被列入信貸“黑名單”;在淘寶上購買了退貨險後屢屢退貨,就可能上騙保“黑名單”。黑白名單是所有反欺詐方法中最簡單的,但也是更新最慢、成本最高的。

  能將異常用戶一網打盡

  有監督學習需要大量有標簽數據來訓練模型,以此來預測還未被標注的數據。以垃圾郵件為例,假如把5000封已由人工確認過的垃圾郵件輸入到模型,模型通過對標題的識別、郵件內容句子的分割、關鍵詞的識別等各種分析方法,找到其中的內在關係。如標題中有“福利”二字的,有90%的可能性是垃圾郵件;一次性發送超過200封的,有60%的可能性是垃圾郵件;回復率低于10%的,有70%的可能性是垃圾郵件……于是,當模型處理一封新郵件時,通過檢測以上各子項,並對每一子項乘以百分比後相加,就能得出垃圾郵件的可能性。但有監督學習的弊端是,每個模型都需要大量訓練數據以及較長的訓練時間。

  “可能你的模型還沒有訓練好,欺詐分子已經完成欺詐活動並尋找下個目標了。”吳中説。

  無監督機器學習主要方式有聚類和圖形分析。金端峰説,無監督無需任何訓練數據和標簽,通過聚類等機器學習算法模型發現用戶的共性行為,以及用戶和用戶的關係來檢測欺詐。“通過無監督機器學習分析用戶的共性行為,可以發現偽裝過的異常用戶,將其一網打盡。”

  何為聚類方式?例如一群用戶注冊事件,可通過聚類發現幾個小群符合某些共性:注冊時間集中,都使用了某種操作係統,某一個瀏覽器版本等。該用戶群中的任何一個單獨拿出來分析,看上去都極為正常,如果符合某種超乎尋常的一致性就十分可疑了。比如一群人在淩晨2—3點採用同一款瀏覽器注冊了同一産品,其IP的前20位相同,GPS定位小于1公裏,注冊後都修改了昵稱和性別等。

  現在的金融欺詐都是團夥作戰,面對“化整為零,批量復制”的欺詐手法,金端峰説,無監督算法應用于反欺詐檢測還有一個優勢,那就是能提前預警。“現在的欺詐分子都有潛伏期,以免太容易被發現。由于他們在潛伏期的行為依然符合某種規律,具有某些一致性,同樣還是會被無監督算法捕捉到。在攻擊發生前就檢測出欺詐分子,這一點傳統方法是難以做到的,防患于未然這也是無監督機器學習之所以在反欺詐檢測中大放光彩的重要原因之一。”

  防患于未然及時預警

  在科技金融活動中,無監督機器學習能有效防止欺詐行為的發生並及時對用戶發出預警,阻止開戶欺詐、欺詐交易、賬號盜取,發現洗錢攻擊等,保障正常的金融活動。

  金端峰舉例説,猛犸反欺詐公司基于非監督式的異常檢測,將數據分解為正常趨勢、隨機擾動和異常情況三部分,並在此基礎上做到設備、網絡和用戶三個層面上的“千人千面”;並根據用戶間的相互關聯構造網絡圖,欺詐者往往團體作案,行為表現在網絡圖中呈現高度一致性和聚集性,與正常用戶明顯不同,因此利用聚類和圖形分析辨別欺詐行為。“螞蟻金服、京東金融等一些高科技互聯網公司也通過無監督機器學習等技術手段,在金融科技方面取得了良好成績。”

  除了有效防止欺詐行為的發生,無監督機器學習在科技金融領域還能有多種作用。比如通過用戶畫像和大數據模型精準找到用戶,實現精準營銷;根據個人投資者提供的風險承受水平、收益目標以及風格偏好等要求,運用一係列智能算法及投資組合優化等理論模型,為用戶提供最終的投資參考,並依據市場動態對資産配置調整提供建議;投資研究需要收集大量資料,進行數據分析,報告撰寫等,通過機器自主抓取相關信息,可以輔助決策,甚至自動生成投研報告;利用大數據人工智能技術,可使用海量的多維度數據,塑造出高度精細化的風險控制模型;通過學習、積累金融法規,並結合金融機構的實際情況提供合規建議;機器還可以從海量的交易數據中學習知識和規則,發現異常行為,對洗錢行為進行警示等。

  應用廣泛可進行投資預測

  無監督機器學習技術的應用正在不斷深入和擴展。愛信諾是上市企業航天信息股份有限公司的全資子公司,在大數據採集、分析和應用方面具有突出能力,建成了以稅務和企業經營數據為核心的企業信用數據庫。

  金端峰説,其實,許多大公司都有大型數據庫,儲存用戶數據信息,通過無監督機器學習分析用戶的整體數據,就能發現用戶金融消費習慣的變化、投資偏好等,自動發現市場分類並針對不同群體用戶推出不同的金融産品。“這樣,有針對性的開發新市場,減少了盲目投入。”

  此外,根據客戶國籍、職業、薪酬、經驗、行業、信用記錄等信息,利用無監督機器學習技術來確定客戶的信用風險評分,甚至是在向客戶提供任何服務之前就進行此類評定,加快放貸過程,還能避免耗時而必要的“盡調”過程。

  “隨著機器學習的使用,股票預測變得相當簡單。”金端峰説,機器學習算法會利用上市企業的資産負債表、損益表等歷史數據,進行分析,並找出關係到公司未來發展的有意義的跡象,進行投資預測。(李禾)

+1
【糾錯】 責任編輯: 張樵蘇
新聞評論
加載更多
玉淵潭早櫻迎春
玉淵潭早櫻迎春
海南海文大橋建成通車
海南海文大橋建成通車
春日鳥瞰“長江第一灣”
春日鳥瞰“長江第一灣”
春花爛漫映峽江
春花爛漫映峽江

010020010010000000000000011105701124250645