從百度文心一言、阿里巴巴通義萬相,到華為雲盤古大模型、京東言犀大模型、中國移動九天大模型……今年以來,ChatGPT持續火爆,掀起人工智能大模型應用熱潮,科技廠商爭先涌入,大模型新産品進入“井噴”階段。據不完全統計,目前全國已經發布了106個大模型。

  調研發現,當前,蘇州工業園區以國家新一代人工智能創新發展試驗區核心區建設為引領,加強重點場景應用突破、牽引行業生態集聚,依託AI大模型加速千行百業的智能化改造和數字化轉型,在為國內大模型突破發展不斷貢獻代表性樣本的過程中,全力打造一流的AI大模型應用創新高地。在園區,從通用大模型、專用垂直領域模型到企業級GPT産品工具研發應用,從語言計算、芯片設計到科技信息服務,以大數據驅動的通用大模型和以知識驅動的垂直行業專業模型深度融合,形成多個應用標杆。

    思必馳:DFM-2樹立語言大模型“新標杆”

  《中國人工智能大模型地圖研究報告》顯示,自然語言處理是目前大模型研發最活躍的重點領域,數量達49個,佔比超過60%。然而,通用語言大模型在行業應用中面臨真實性存疑,私域知識難包含、不準確,判別式任務精度及時效性不足等問題,再加上模型訓練所需數據量巨大,在實際應用中還存在成本高、速度慢等缺陷。

  思必馳科技股份有限公司(以下簡稱“思必馳”)聯合創始人、首席科學家俞凱認為,行業語言計算大模型在解決這些問題方面更具優勢,因其既具備情境理解、指令學習等通用智能及知識,又能夠在行業場景落地中實現個性化知識技能定制、小型化低成本部署、全鏈路低延遲交互等,通過大模型與對話式語言技術的聯動,能夠為用戶帶來更優質的體驗。

思必馳DFM-2發布會現場

  作為國內最早開啟對話式人工智能系列技術研發的公司之一,思必馳在對話式語言基礎大模型領域技術積累豐厚,2021年提出Dialogue Foundation Model(DFM)模型,率先實現集理解、生成、表徵三大能力為一體;2022年發布DialogZoo數據集,是目前國際上最全的公開對話研究數據集合&&;今年7月正式發布百億參數行業語言計算大模型DFM-2,在通用場景28項任務上做到行業領先。

  據介紹,作為具有通用智能的行業語言大模型,DFM-2既具備常識問答、內容生成、數學計算和代碼生成等通用智能能力,又與全鏈路綜合對話技術聯動,可以實現具體的場景化落地,滿足行業個性化需求,有效解決技術廠商的通用型技術與B端企業高度靈活的個性化需求無法匹配的行業痛點。

  以物聯網領域為例,智能終端存在算力各異、需求分散、場景龐雜、定制需求多、完整交互體驗要求高等特點,這決定了通用人工智能技術很難在複雜多變的智能終端和應用場景中落地。思必馳基於通用人工智能技術不斷發展完善自身的産品標準化能力和規模化定制能力,能夠支持客戶自主構建個性化語音交互解決方案,滿足不同場景複雜個性化需求,實現人工智能的柔性定制,大大提升標準化軟硬體産品的“非標交付”效率。

  為進一步滿足市場的多元化需求,思必馳將全鏈路智能對話系統定制開發&&(DUI)與DFM-2大模型相結合,推出DUI 2.0,完成對話式AI全鏈路技術升級。目前,DUI 2.0已在智能汽車、智能家居、政務服務、醫療健康、科學研究等領域得到應用,例如思必馳自研的汽車語音助手天琴系統,會議辦公類軟硬體産品“麥耳會記”、AI轉寫麥克風音箱M6、AI追蹤雙目語音攝像頭C60等均已上市並得到廣泛應用。

  俞凱&&,未來,思必馳將緊抓科技部“語言計算國家新一代人工智能開放創新&&”建設機遇,持續深入應用場景,基於DFM-2大模型能力及相關技術成果,與專有場景深度結合,打造更具行業特色的專用模型,賦能千行百業。

    智慧芽:“AIGC+搜索引擎”打造科技創新信息服務“智能助手”

  科技情報是科技創新不可或缺的戰略資源。研究表明,科研人員充分利用專利情報,能節約科研經費40-50%,節省科研時間60-70%。隨着科學研究範式發生深刻變革,傳統的科技信息服務已無法滿足實際創新需求,且海量數據的人工處理成本極高,制約了科技創新效率進一步提升。

  “大語言模型等人工智能相關技術的突破,極大提升了科技創新信息獲取效率,將催生全新形態的産品服務。”智慧芽信息科技(蘇州)有限公司(以下簡稱“智慧芽”)創始人兼CEO張濟徽説。實際上,將GPT大模型技術引入科技創新信息服務領域,需要具備一系列條件,如要有覆蓋面足夠廣泛的研發數據庫,建立專門針對該領域的數據分析算法模型,形成相對完備的産品矩陣以滿足研發人員的多元化需求等。

智慧芽專利數據庫服務界面

  其中,數據資源是核心要素。1.76億+全球專利數據、1.6億+科技文獻數據,260萬+科研資助信息、86萬+投資信息,6.1萬+全球新藥數據、4.4萬+靶點數據……作為科技創新信息服務商,智慧芽多年來積累的海量專利文獻數據、科研信息數據和生物醫藥數據,為訓練類GPT大模型奠定了紮實的數據基礎。在算法層面,智慧芽運用深度學習、自然語言處理、計算機視覺以及預訓練語言模型等技術,在海量全球多語言技術文本中進行自動化、智能化的數據分析與文本挖掘,並實現深層次語義分析。

  今年以來,智慧芽將大模型技術引入科技創新信息服務領域,計劃於年內推出基於知識産權與研發創新場景開發的大語言模型“智慧芽GPT”,並同步上線專利檢索專家、技術交底書助手、技術研發助理等功能,幫助研發人員自動編寫複雜檢索式、自動撰寫技術交底書,且能夠對話式解答研發人員的技術問題。

  “當前,科技創新信息服務仍停留在工具階段,不能稱之為強大助手。例如大部分專利數據庫本質上就是專利領域的搜索引擎,返回的是大量技術文檔而非直接答案,很難滿足用戶複雜、結構化的需求。”張濟徽説,智慧芽的目標是打造“AIGC+搜索引擎”新模式,當用戶提出問題後,該應用可快速理解用戶意圖,並從相關搜索結果中給出經處理的總結性回答。未來,通過調用智慧芽底層的産品能力,用戶僅需通過一個聊天框輸入問題就能快速得到想要的答案,為科技創新信息服務打造真正強大的“智能助手”。

    異格技術:借力企業級GPT産品推動芯片研發設計跑出“加速度”

  一邊,借助公用大模型,自研企業辦公工具和知識庫,輔助員工進行代碼開發、技術手冊編寫等;一邊,積極研發部署內部私有大模型,實現對內部代碼的生成、審查、註釋等功能,顯著提升研發效率……位於蘇州工業園區的蘇州異格技術有限公司(以下簡稱“異格技術”)專注於國産高端FPGA芯片的研發與設計,該企業幾年前便着手布局大模型等AI技術工具在芯片設計領域的應用,今年更是引入專業高層次人才,並成立單獨部門專項負責相關技術研發,初步成效開始顯現。

  高性能芯片設計比較複雜,需要花費大量的時間和人力成本。在設計過程中,任何一個錯誤都可能導致大量時間和資源的浪費,甚至導致整個項目的失敗。“把大模型技術引入芯片設計領域,能夠大幅減少研發過程中一部分重復且繁雜的工作,縮短産品開發周期,還可以幫助設計師整合通信、控制和信號處理等不同領域知識,以實現更高效和創新的設計。”異格技術相關部門負責人説。

  目前,異格技術正在嘗試將大模型技術應用於芯片驗證中,對部分公開協議代碼的研發已經實現明顯的效率提升。該企業還利用公用大模型 API構建了飛書機器人,實現對公用大模型信息交互的安全管控,飛書機器人中內置各種角色,支持語言對話、圖像生成等功能,極大提升員工辦公效率。

  在使用公用大模型基礎上,異格技術嘗試構建內部知識庫,對代碼或文檔進行深層次分析,包括頂層架構、代碼細節設計到算法、數據結構,通過整合公司內部的文檔和API參考,使開發人員更方便查找所需內部信息,提高開發效率。

  “下一步,我們計劃研發採用FPGA芯片的AIGC大模型企業級私有化部署方案。該方案專注對模型進行優化壓縮(量化、剪枝等)以更適配FPGA芯片,同時更好滿足金融、通信、邊緣計算等領域應用需求。”異格技術相關部門負責人説。

  278平方公里不算寬廣的土地上,大模型技術與各細分場景的融合應用正以極高的密度涌現,並逐步走向“深水區”。

  目前,一大批園區企業正基於原有人工智能技術和行業數據積累,積極布局通用大模型、專用垂直領域模型以及企業級GPT産品工具研發和應用等大模型賽道,推動技術創新、場景落地和生態建構。如美能華智借助大模型技術及互聯網海量中英文語料,開發企業級大語言模型——星語大語言模型,並推出星語專家系統、小星助手兩款應用産品,服務範圍涉及政務、金融、跨境物流、醫療健康等多個領域。企查查發布全球首款商查大模型——企查查“知彼阿爾法”,百圖生科研發生命科學大模型驅動的AIGP(AI Generated Protein)&&,清睿教育發布教育領域清睿ArynGPT大模型等。

  AI大模型應用同時帶動算力需求猛增。據統計,園區僅30家人工智能核心企業的算力需求就達到172 PFLOPS。依託國科數據中心這一亞洲首家按照國際數據中心行業最高等級(Tier IV)標準設計和建設的第三方專業數據中心,該區正加快構建多雲互聯、算力互聯新模式,與華為雲等主流雲服務商以及上海超算中心、昆山超算中心、合肥先進計算中心等加強合作,充分利用本地自建算力單位,提升算力調度能力,實現算力資源的橫向擴展,滿足企業算力需求。

  為進一步推動大模型的應用推廣,搶抓AIGC新賽道,園區將以國家新一代人工智能創新發展試驗區核心區建設為引領,加強垂直領域攻關,實現重點場景應用突破,豐富行業應用生態,緊跟大模型相關技術發展趨勢,加速匯聚高端資源,堅持以産業創新為引領、科技創新為動力、開放創新為支撐,通過AI大模型應用創新高地建設,為開放創新的世界一流高科技園區增添更多動力。(王夢菲 李優)