都可賦予大模型慢思考能力 360首創CoE架構媲美OpenAI o1思維鏈模式-經濟參考網

　　9月13日，OpenAI發布具有推理能力的人工智能模型“o1”，備受行業矚目。o1通過模仿人類的思維過程，強化學習和“思維鏈”技術，引導模型自主解決問題。這一特點在解決複雜問題，尤其是在科學、編碼和數學等領域，展現出了超越以往模型的強大能力。

　　據了解，o1和GPT系列模型最大的區別主要在於，該系列模型是在思考之後回答用戶問題，輸出高質量的內容，而非迅速回應無效答案，即用模仿人類思維過程的“慢思考”代替過去追求快速響應的“快思考”，這與國內一家大模型企業在近兩個月前提出的觀點不謀而合——早在今年7月底舉辦的ISC 2024大會上，360集團創始人周鴻祎就宣布，360將“用基於智能體的框架打造慢思考系統，從而增強大模型的慢思考能力”，並在近期多次強調，將“利用智能體框架，讓大模型從快思考轉成慢思考模式，把多個大模型組合起來解決業務問題”。

　　對於o1的推出，周鴻祎在其最新發布的短視頻中&&，過去建立在大參數、大數據量的模型技術演進終於找到了新的突破方向，也為下一個階段人工智能的進步和應用開闢了巨大的空間。“o1不是像大模型一樣用文字來訓練，而是像自己和自己下棋一樣，通過強化學習來實現這種思維鏈的能力”，周鴻祎説。

　　周鴻祎用“快思考”和“慢思考”兩項人類具備的能力對思維鏈強大的原因進行了解讀。他指出，快思考的特點是快速直覺、無意識，反應很快但能力不夠強。GPT類大模型通過訓練大量知識，主要學習的是快思考能力，這也是為什麼GPT類大模型脫口而出的答案質量不夠穩定，“就像人一樣，不假思索出口成章而不出錯非常難實現”；慢思考的特點則是緩慢、有意識、有邏輯性，需要分很多步驟，類似寫一篇複雜的文章，要先列提綱，根據提綱去蒐集數據，收集素材，根據素材進行討論，再把文章寫出來，還要進行潤色和修改。“這一次o1擁有了人類慢思考的特質，在回答問題前會反復地思考，拆解、理解、推理，可能會自己問自己1000遍，然後才能給出最終的答案。”

　　不過，儘管在“慢思考”能力上取得了巨大突破，o1依然難稱完美。據媒體報道，目前的o1-preview版本依舊存在幻覺問題、運行速度較慢及成本高昂等諸多局限性，限制了其應用範圍。與之相比，更早提出“慢思考”概念的360通過其首創的CoE(Collaboration of Experts，專家協同)技術架構及混合大模型對“慢思考”進行落地實踐，該技術架構已落地在360 AI搜索、360 AI瀏覽器等多款産品中。AI助手通過CoE架構還接入了很多小參數專家模型，在回答簡單問題時調用更精準的“小模型”，在獲得高質量回答的同時還能節約推理資源、提升響應速度，實現對“慢思考”過程中速度過慢等問題的改進。

　　據了解，近期有國內技術團隊通過將思維鏈優化為CoE協同工作模式，使用任意三個模型協同工作達到了和OpenAI o1-preview類似的反思決策效果。經過21道複雜邏輯推理題測試結果顯示，其效果與OpenAI o1-preview相當，完全超越GPT-4o，有時還能超越o1-preview。

　　“所以，以後比的不是多快能給你答案，而是給的答案完不完整，這也會改變人工智能服務的業態，人工智能到最後還是要參考人類大腦的組成來構造工作模式”，周鴻祎説。

首頁 >> 正文