新華通訊社主管

首頁 >> 正文

都可賦予大模型慢思考能力 360首創CoE架構媲美OpenAI o1思維鏈模式
2024-09-16 來源:中國網

  9月13日,OpenAI發布具有推理能力的人工智能模型“o1”,備受行業矚目。o1通過模仿人類的思維過程,強化學習和“思維鏈”技術,引導模型自主解決問題。這一特點在解決複雜問題,尤其是在科學、編碼和數學等領域,展現出了超越以往模型的強大能力。

  據了解,o1和GPT系列模型最大的區別主要在於,該系列模型是在思考之後回答用戶問題,輸出高質量的內容,而非迅速回應無效答案,即用模仿人類思維過程的“慢思考”代替過去追求快速響應的“快思考”,這與國內一家大模型企業在近兩個月前提出的觀點不謀而合——早在今年7月底舉辦的ISC 2024大會上,360集團創始人周鴻祎就宣布,360將“用基於智能體的框架打造慢思考系統,從而增強大模型的慢思考能力”,並在近期多次強調,將“利用智能體框架,讓大模型從快思考轉成慢思考模式,把多個大模型組合起來解決業務問題”。

  對於o1的推出,周鴻祎在其最新發布的短視頻中&&,過去建立在大參數、大數據量的模型技術演進終於找到了新的突破方向,也為下一個階段人工智能的進步和應用開闢了巨大的空間。“o1不是像大模型一樣用文字來訓練,而是像自己和自己下棋一樣,通過強化學習來實現這種思維鏈的能力”,周鴻祎説。

  周鴻祎用“快思考”和“慢思考”兩項人類具備的能力對思維鏈強大的原因進行了解讀。他指出,快思考的特點是快速直覺、無意識,反應很快但能力不夠強。GPT類大模型通過訓練大量知識,主要學習的是快思考能力,這也是為什麼GPT類大模型脫口而出的答案質量不夠穩定,“就像人一樣,不假思索出口成章而不出錯非常難實現”;慢思考的特點則是緩慢、有意識、有邏輯性,需要分很多步驟,類似寫一篇複雜的文章,要先列提綱,根據提綱去蒐集數據,收集素材,根據素材進行討論,再把文章寫出來,還要進行潤色和修改。“這一次o1擁有了人類慢思考的特質,在回答問題前會反復地思考,拆解、理解、推理,可能會自己問自己1000遍,然後才能給出最終的答案。”

  不過,儘管在“慢思考”能力上取得了巨大突破,o1依然難稱完美。據媒體報道,目前的o1-preview版本依舊存在幻覺問題、運行速度較慢及成本高昂等諸多局限性,限制了其應用範圍。與之相比,更早提出“慢思考”概念的360通過其首創的CoE(Collaboration of Experts,專家協同)技術架構及混合大模型對“慢思考”進行落地實踐,該技術架構已落地在360 AI搜索、360 AI瀏覽器等多款産品中。AI助手通過CoE架構還接入了很多小參數專家模型,在回答簡單問題時調用更精準的“小模型”,在獲得高質量回答的同時還能節約推理資源、提升響應速度,實現對“慢思考”過程中速度過慢等問題的改進。

  據了解,近期有國內技術團隊通過將思維鏈優化為CoE協同工作模式,使用任意三個模型協同工作達到了和OpenAI o1-preview類似的反思決策效果。經過21道複雜邏輯推理題測試結果顯示,其效果與OpenAI o1-preview相當,完全超越GPT-4o,有時還能超越o1-preview。

  “所以,以後比的不是多快能給你答案,而是給的答案完不完整,這也會改變人工智能服務的業態,人工智能到最後還是要參考人類大腦的組成來構造工作模式”,周鴻祎説。

凡標注來源為“經濟參考報”或“經濟參考網”的所有文字、圖片、音視頻稿件,及電子雜誌等數字媒體産品,版權均屬《經濟參考報》社有限責任公司,未經書面授權,不得以任何形式刊載、播放。獲取授權

《經濟參考報》社有限責任公司版權所有 本站所有新聞內容未經協議授權,禁止轉載使用

新聞線索提供熱線:010-63074375 63072334 報社地址:北京市宣武門西大街57號

JJCKB.CN 京ICP備18039543號