大模型加速釋放AI潛能

2024-01-15 14:21:32 來源: 瞭望 2024年第3期

  

➤自2023年8月百度發布飛槳星河社區以來,已推出了超4000個基於文心大模型的創新AI應用

➤臨洮縣水務局與百度智能雲共同搭建了國內首個“人工智能防溺水應急救援體系”,上線當月,防溺水系統第一個生命救援成功,至今以來已成功阻止多起高危行為

  文 |《瞭望》新聞周刊記者 扈永順

  

  “安裝人工耳蝸後,能不能用AI幫學説話?”由於遺傳原因,來自內蒙古的李朋程出生時便失去聽力,安裝人工耳蝸後,還要負擔一筆“學説話”費用,因為安裝人工耳蝸後並不能馬上聽懂別人在説什麼,要想通過康復師學習説話,“一個月最少需要5000元,很多人負擔不起。”

  李朋程的需求在“聲橋AI語訓”團隊得到了解決。該團隊負責人唐璇説,他們設計了一款利用AI技術幫助聽障人士進行糾音的産品,“通過識別聽障人士的語音,針對其中不清楚或錯誤的部分,用AI給出具體建議,指導他們修改和進步,降低了學習説話的成本。”

  “聲橋AI語訓”幫助聽障人士學習説話的能力,來自百度文心一言大語言模型的功能延伸。當前,基於強算法、大算力和大數據的大模型成為人工智能發展的主流方向,為人工智能技術及應用提供了新基座。

  近日,在WAVE SUMMIT+深度學習開發者大會上,百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰公布了推進AI價值創造的最新進展:文心一言用戶規模突破1億;截至2023年12月底,飛槳已凝聚1070萬開發者,服務23.5萬家企事業單位,基於飛槳創建了86萬個模型;自2023年8月百度發布飛槳星河社區以來,已推出了超4000個基於文心大模型的創新AI應用,“聲橋AI語訓”就是其中之一。

  大模型基礎逐步夯實

  2023年以來,AI大模型技術浪潮持續火熱。一些高校院所和創新型企業加大研究力度,大模型技術不斷迭代升級,包括百度、阿里巴巴等互聯網公司以及復旦大學等科研機構,紛紛推出了自己的大模型。

  公開資料顯示,截至2023年10月份,國內已經發布了238個大模型,按類型可分為通用和行業垂直兩類,通用大模型通過從海量數據中學習共性知識,成為具有通用性和泛化能力的模型底座。

  “人工智能具有多種典型能力,理解、生成、邏輯、記憶是其中的核心基礎能力,這四項能力越強,越接近通用人工智能,而大語言模型具備了這四項能力,為通用人工智能帶來曙光。”王海峰&&。

  以文心一言為例,2023年3月,百度發布了文心一言大語言模型,用戶使用場景非常廣泛,從歡迎詞、演講稿到企劃書、説明書,再到流程圖、思維導圖等,涵蓋了工作和生活的諸多方面。

  文心一言大語言模型是文心大模型系列中的一部分。百度自2019年起深耕預訓練模型研發,發布了文心大模型1.0版本。文心一言的基礎模型是文心大模型3.0。此後文心大模型快速升級到了3.5、4.0版本,理解、生成、邏輯和記憶四大AI基礎能力全面提升。

  王海峰介紹,文心大模型升級是基於在多個關鍵技術方向上進一步的創新突破,在知識增強、檢索增強、對話增強的基礎上進行了知識點增強、邏輯增強,以及增加插件和智能體機制等。

  用大模型解決“剛需”

  大模型研發門檻高、難度大,只有真正融入千行百業,解決産業發展的“剛需”,讓産業從AI中收穫價值,大模型才能實現可持續發展。

  《北京市人工智能行業大模型創新應用白皮書(2023年)》提出,從模型演進看,通用大模型趨於收斂,垂直行業應用成為大模型産業落地的關鍵賽道。當前,大模型發展呈現出從技術到産品、再到商業化應用的發展路徑,並不斷深入垂直行業領域。

  在深入垂直行業領域過程中,大模型依賴算法、算力和數據綜合支撐,産業化面臨挑戰。王海峰&&,具有算法、算力和數據綜合優勢的企業,可以將模型生産的複雜過程封裝起來,通過低門檻、高效率的生産&&,為千行百業提供大模型服務。

  目前,文心大模型已大規模應用於搜索、信息流、智能音箱等互聯網産品,並通過飛槳開源開放&&、百度智能雲賦能製造、能源、金融、通信、媒體、城市、教育等各行各業。隨着應用場景的進一步擴大,文心大模型已與各行業頭部企業、機構共建了超過10個行業大模型,助力企業降本增效,加快行業數智化轉型升級。

  在甘肅省臨洮縣,洮河穿越整個城區,每年都有溺水事件發生。2023年6月,臨洮縣水務局與百度智能雲共同搭建的國內首個“人工智能防溺水應急救援體系”上線,科研人員通過AI視頻分析測試數據、搭建防溺水模型,並用大量高質量場景化數據訓練模型,能夠對城區河道翻越欄杆、靠近水流、危險區域徘徊等危險行為第一時間識別和告警,為後續的應急處置、救援爭取了寶貴時間。上線當月,防溺水系統第一個生命救援成功,至今已成功阻止多起高危行為。

  百度還基於文心大模型對國家跳水隊AI輔助訓練系統進行了全面升級,系統不僅能理解和執行教練與運動員的複雜指令,及時提供準確信息,還可以對動作實時打分、精準量化分析。2023年,中國游泳協會授予百度“中國國家跳水隊人工智能合作夥伴”稱號。

  文心大模型還應用於華人尋根中。通過與國家圖書館合作,文心大模型大量學習古代方志和家譜數據,並進行文字識別和理解,同時綜合應用地點、職業、飲食、重要事跡等信息的知識圖譜,在文心一言上線了“古文今問”服務。用戶只需輸入尋根信息,就能得到相應的線索反饋。

聽障人士正在使用“聲橋 AI 語訓”練習説話   受訪者供圖

  為AI原生應用提供全要素支撐

  為推動大模型産生更多原生應用,近期百度圍繞社區生態對星河社區進行了一系列新升級。

  記者從百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜處了解到,全新發布的星河社區大模型工具中心,包括飛槳産業級模型庫、百度大腦AI能力、文心一言工具等,同時支持生態工具接入,提供了可視化交互界面,參數配置靈活多樣,預覽效果實時呈現,為開發者提供了AI原生應用全要素,包括開發、體驗、推廣、交流一體化服務。

  在生態共創方面,百度發布了文心大模型星河共創計劃,將與開發者和生態夥伴共同激活數據資源價值,共建大模型插件,廣泛創新AI應用。

  此外,為加速AI人才培養,2020年百度提出“5年為全社會培養500萬人工智能人才”的目標,目前培養的人才數量已完成目標的84%。大模型技術日新月異,對於AI人才也提出了更高要求,2023年百度發布了AI人才培養新舉措——星河計劃。

  “我們將與産學研各界密切合作,深化産教融合,為社會再培養500萬大模型人才。”王海峰&&,之所以這麼做,是為了讓AI科技的“創新之花”結出更多“産業之果”,服務國家戰略、服務社會發展、服務人民福祉。