上海打造大模型産業高密度創新“苗圃”-新華網
新華網 > > 正文
2024 04/03 07:41:48
來源:經濟參考報

上海打造大模型産業高密度創新“苗圃”

字體:

  2024年世界行動通訊大會上,一款搭載人工智慧生成內容(AIGC)技術的筆記型電腦引發圍觀。 新華社記者 高靜 攝

  近日,2024全球開發者先鋒大會在上海舉行。為期兩天的大會,匯聚了國內外超過100家開發者社區、100余家知名投資機構。OpenAI前高管扎克·卡斯、硅谷“創投之父”史蒂夫·霍夫曼等“大咖”也來滬與全球開發者交流。在此次大會的舉辦地徐匯濱江,上海首個大模型創新生態社區已然成形。僅僅成立半年,就吸引了近60家大模型企業,以及200余家産業鏈上下遊企業資源匯聚。

  以應用牽引,發布市級應用場景;培育生態,做好算力、數據等關鍵要素供應;加大開源、開放力度,降低廣大創新創業團隊和中小企業的大模型訓練門檻……近年來,上海積極培育人工智慧産業沃土,逐漸成為大模型産業高密度創新的苗圃基地。

  大模型産業“風起雲湧”

  大會上,上海人工智慧實驗室領軍科學家林達華用“風起雲湧”來形容近幾年全球大模型産業的發展。

  2022年,ChatGPT橫空出世,大模型開始走入大眾視野,成為全球焦點。2023年2月,Meta公司發布LLaMa並催生發展出開源社區,大模型從“只會聊天的工具”,變成了有可能會進入到“嚴肅生産領域”的生産力。邁入2024年,Sora的出世、Claude 3.0展現出的強大推理能力,以及馬斯克剛剛開源的Grok,都代表著整個行業處在“方興未艾”的賽道。

  “大模型行業的發展有兩個非常重要的驅動力量。一個是源于所有研究者和從業者對于技術理想的追求,不斷突破邊界,尋求越來越接近AGI(Artificial General Intelligence,人工通用智能)的大模型;同時産業界也看到了大模型帶來産業革命的可能性,無數企業投入巨大資源到這個賽道中。兩股力量交織在一起,形成了我們今天看到的大模型産業‘波瀾壯闊’的局面。”林達華表示。

  而在國內,大模型産業的發展同樣突飛猛進。去年3月份,百度發布“文心一言”,此後,阿里巴巴的“通義千問”、科大訊飛星火大模型、騰訊混元大模型陸續發布上線。互聯網大廠之外,華為、京東、字節跳動、商湯科技,乃至三大電信運營商、各科研院所和高校的大模型産品也不斷推出。有統計數據顯示,中國研發大模型的公司已有100多家,邁入“百模大戰”階段。

  同時,大模型行業也在不斷涌現出新的課題。以算力為例,微軟原全球執行副總裁沈向洋稱,發展大模型産業,算力是門檻。隨著大模型參數的增加,對算力的需求幾乎是幾何級增長的。另外,包括ChatGPT在內,大模型還帶來了“一本正經地胡説八道”、“深度偽造”等倫理問題,需要各方加強治理。

  此外,當前主流的大模型都是建立在Transformer架構堆疊的基礎上,但這一架構對計算資源的消耗特別大。騰訊混元大模型演算法負責人康戰輝表示,當下越來越多的企業看到了MoE(即:混合專家模型)展現出來的優良特性,未來可能還會有更加高效的架構出來。

  産業應用“繁花綻放”

  有行業人士將2024年比作大模型應用的“元年”,認為行業的競爭焦點正在從基礎模型到應用遷移。從目前來看,大模型確實已經落地到各行各業,生根發芽。

  “大模型+科學”可以産生哪些化學反應?上海人工智慧實驗室青年科學家白磊介紹,實驗室發布“風烏”大模型,可用以預測氣象。由于大氣係統的復雜性,全球中期天氣預報的有效性每10年才提高1天。此前,全球范圍內最好的物理模型有效預報時長最大為8.5天,而“風烏”達到了10.75天,且預測時間僅需30秒。

  機器人與大模型的結合領域“具身智能”也是熱點。“傳統的機器人需要編程,需要寫固定的代碼,造成之前的人機交流非常僵硬。現在,我們告訴機器人它的手臂快碰到天花板了,在沒有任何方向性指示的情況下,它能夠理解,且做出正確反應。這在傳統的機器人編程中,是不可想像的。我們期待,大模型能給機器人一顆通用的大腦。” 中電科21所高級專家劉一帆表示。

  “過去藝術家們通過AI軟件進行藝術作品的設計,今天有更多的藝術家通過AI完成藝術作品的創作。此外,從去年下半年開始,包括電商、行銷等領域,也有非常多的大模型産品涌現出來。”智象未來産品總監弓子健説。

  林達華認為,圍繞大模型應用,産業分工會逐漸形成。“做基礎模型的企業並不會壟斷一切。如果從業者能夠憑借自己在行業裏積累的數據和經驗,並基于自身的資源稟賦和數據優勢積極尋找差異化發展路徑,最終形成競爭力,我們的大模型産業一定會‘一路繁花’。”

  著力建設“大模型之都”

  人工智慧是上海重點發展的三大先導産業之一。伴隨著新一代人工智慧的發展,大模型熱潮掀起,上海正在著力建設“大模型之都”。

  懷著“栽好梧桐樹,引得鳳凰來”的美好願景,上海以徐匯西岸為核心,啟動了首個人工智慧發展集聚區建設。如今,作為上海首個大模型創新生態社區,誕生于徐匯人工智慧産業沃土的“模速空間”,已成為大模型産業高密度創新的苗圃基地。

  上海徐匯區委常委、副區長俞林偉對“模速空間”名字的由來進行了解釋。他説,“‘模’意味著成千上萬的開發者在這裏創新創業,百花齊放。這裏是場景的試驗田,也是應用的孵化器。‘速’則指通過市、區攜手,為企業提供全方位的加速服務。”

  轉眼間,“模速空間”挂牌已近半年。如今有超過60家大模型企業與他們身後200余家産業鏈上下遊企業的資源匯聚在黃浦江畔這一方天地。

  對于大模型企業來説,數據的體量、品質、多樣性缺一不可,均對大模型能力的提升有重要意義。如何能夠生産大規模、高品質的數據,也是各個大模型研發機構某種意義上“競爭壁壘”所在。

  此外,算力同樣重要,不管是大模型研發企業,還是應用類公司,高算力成本都令人頭痛。如何提供普惠的算力,通過較低成本把大模型在垂直行業真正用起來,讓更多的中小企業、個人開發者加入大模型的開發中,也是行業關注的問題。

  記者了解到,“模速空間”五個公共服務平臺作為“土壤雨露”,可為創新企業提供開放數據、算力調度、能力評測、備案輔導、融資服務等公共服務,提供關鍵要素保障。

  以算力調度平臺為例,“模速空間”聯合運營商和雲廠商共同保障大模型企業算力,目前商湯、儀電、火山超5萬張GPU可供調配。其開放數據平臺依托浦江實驗室牽頭的大模型語料數據聯盟,持續開源發布高品質數據集,數據總量近5TB,下載量近14萬次,行業覆蓋10余類。

  面向未來,大模型産業的發展尚有許多挑戰。對此,上海已明確,未來將加強核心技術的突破,推動智能晶片關鍵技術和應用適配,打造更多元開放的智能計算生態。同時,完善標準體係、安全準則、倫理規范,推動人工智慧、區塊鏈、元宇宙等前沿技術的開發和應用。

  上海市副市長陳傑表示,未來上海將進一步加大開源開放的力度,探索大模型的新型開源和推廣模式,以降低廣大創新創業團隊、中小企業等大模型訓練的門檻,推出更多具有示范性、標誌性的應用場景,來牽引大模型在金融、教育、醫療、制造等典型領域的垂直應用。(記者 杜康)

【糾錯】 【責任編輯:冉曉寧】