行業創新:大模型進行時

2023-05-25 07:09:25 來源: 《環球》雜志

 

4月18日,一款智能線性機器人在德國漢諾威工業博覽會上進行工作演示

  商業化潛力的釋放將加速大模型在各行各業的應用落地,在走向實體的過程中成為人類強有力的生産力工具,引發更大范圍的顛覆性變革。

文/《環球》雜志記者 張漫子

編輯/馬瓊

  近期,生成式人工智慧技術及産品的快速迭代正將大模型從幕後推向臺前,並火速引爆了全球熱潮。

  當人們拉長時間線,審視大模型的前世今生,就會發現其“破圈”走紅並非曇花一現,而是行之有效的技術路線和多年深耕下的大勢所趨,大模型已然成為人工智慧賽道的又一裏程碑。

  如果説昔日冰冷的技術名詞離日常生活過于遙遠,人工智慧熱潮中的這波大模型産品及應用卻在重塑著千行百業,讓人們真切體會身處技術變革的浪潮之巔,直面大模型帶來的創新與顛覆。

從“大煉模型”到“煉大模型”

  國際數據公司(IDC)預測,2026年中國人工智慧軟件及應用市場規模將達211億美元,人工智慧進入大規模落地應用的關鍵時刻。開發門檻高、應用場景復雜多樣、對場景標注數據路徑依賴等問題也隨之而來,而大模型憑借其泛化性、通用性和遷移性等優勢,將點亮新的希望。

  上一代人工智慧面臨“單領域、低縱效”的瓶頸。標注清洗數據的成本高昂,只有單一領域的數據集,且各模型、各數據集間存在壁壘,局限于所接受的訓練,諸多因素致使人工智慧的通用泛化能力不足。

  基礎大模型的出現則提供了破局的新思路。對海量多源數據進行自監督學習,借助“預訓練+微調”的方式即可輕松處理五花八門的任務,實現從文本、語音、視覺等單一模態智能向跨場景、多任務的多模態方向演進,基礎大模型在跨領域內容學習、跨領域能力獲取方面實現了質的飛躍。

  2017年,Transformer網絡架構的提出使深度學習模型的參數達到1億規模,並在此基礎上分化出兩大技術路線:以自回歸為主、採用單向Transformer的GPT模型,和以自編碼為主、採用雙向Transformer的BERT模型。

  其中,相較于更適合完成理解類任務的BERT模型,GPT在自然語言的生成方面更具優勢,也是目前國際上大量主流大模型採用的模型架構。而國內很多大型語言模型採用的是結合以上二者的T5模型,包括單向語言預訓練和任務微調兩部分,可以兼顧理解和生成兩大類任務。

  面對人工智慧帶來的各種挑戰,能夠提供通用化解決方案的大模型,已然成為新一輪人工智慧競技的重要賽道。

  美國科技巨頭谷歌、微軟、亞馬遜等均在大模型領域展開布局,包括OpenAI最新發布的“史上最強”多模態預訓練大模型、谷歌的全球最大視覺語言模型PaLM-E,以及微軟將OpenAI大模型與自家結合發布的網絡安全産品Microsoft Security Copilot。

  相比之下,中國大模型發展仍處于快速增長階段,國內各科技企業紛紛入局,包括百度的“文心一言”、阿裏的“通義千問”、騰訊的“混元”、華為的“盤古”等多個大模型。此外,部分研究機構也在進行大模型的嘗試,比如北京智源人工智慧研究院的“悟道”、中國科學院自動化研究所的“紫東太初”等。

  在這一波大模型發展浪潮之中,不少人工智慧企業經歷了從“大煉模型”到“煉大模型”的范式轉變,而隨著參與企業越來越多、參數規模越來越龐大,大模型已經成為未來人工智慧技術和産業生態的核心。

把握住應用這個機遇

  在大模型的競逐中,落地應用才是關鍵的“最後一公里”。

  百度創始人、董事長兼首席執行官(CEO)李彥宏打了個比方,“基于這種大語言模型開發應用機會很大,沒有必要再重新發明一遍輪子,有了輪子之後,做汽車、飛機,價值可能比輪子大多了。”

  專家認為,與其糾結于大模型自身的調優升級、復制已有路徑,不如另辟蹊徑,聚焦落地應用層面,充分發揮中國的現有優勢——豐富多樣的落地場景、龐大的用戶數量和數據資源,以及大量亟待轉型升級的産業需要利用新技術工具實現高效快速迭代等。

  微軟亞洲研究院原副院長周明認為,在把模型做到相當大的同時,也要快速考慮它的落地,結合用戶需求量體裁衣、定向優化,推動大模型在不同行業的應用。

  以生命科學領域為例,由于生命體具有高度復雜性,且目前數據量極大,包括十億甚至百億量級的蛋白質序列,以及需要測量幾萬基因的單細胞組學,如此龐大的數據量已無法通過傳統工具進行操作分析,大規模預訓練模型為理解復雜的生命科學問題提供了可能性。

  3月23日,生命科學平臺公司百圖生科在北京推出了首個基于跨模態生命科學大模型xTrimo的蛋白質生成平臺AIGP。xTrimo擁有千億級的參數量,可將蛋白質、蛋白質相互作用、細胞、復雜生物係統作為一個整體進行建模,形成4層嵌套結構。同時,為判斷生成蛋白的好壞,其還可以借助高通量的實驗進行驗證,全部數據最終回流並反哺大模型。

  據百圖生科首席技術官(CTO)宋樂介紹,基于這一大模型,該平臺能根據用戶需求生成對應的蛋白。以胃癌病人為例,在輸入病人的疾病資訊或多組學數據時,AIGP能夠自動分析並找到胃癌靶點,根據靶點生成一個抗體甚至一係列有多樣性的蛋白,最後直接生成的蛋白將回到自動實驗室裏合成蛋白。

  中國科學院院士董晨認為,AIGP利用人工智慧技術推演出蛋白質的結構,理解蛋白質的功能和動態變化,一方面能夠揭示生命科學的基本規律,另一方面在醫療健康領域,比如對研發新藥會有非常大的作用。

避免盲目“跟風”“燒錢”

  大模型在持續引爆全球關注熱潮的同時,也不斷吸引著新老玩家入局。更大的模型、更多的數據、更強的算力,成為企業競相追逐的目標。但正如事物的發展總是沿著螺旋式上升的軌道,大模型的發展也無捷徑可言。

  一方面,大模型愈發龐大的參數量和計算量對算力、演算法、數據提出了更高要求。

  對國內絕大多數人工智慧企業而言,盲目躍進、一頭扎進大模型賽道刷參數的做法並不明智,既無法打通堵點,也無法承擔高昂的交付和運維成本,搞不好會竹籃打水一場空。

  在微軟亞洲研究院原副院長周明看來,跟風式“燒錢堆參數”的路徑,並不適用于所有人工智慧企業,特別是大量新生的中小型人工智慧賽道企業。

  而國內一些企業和研發機構正在探索以更少的能耗輸出更高算力的路徑。億鑄科技董事長李濤説,芯粒、3D封裝和存算一體等先進技術有望助力企業突破大模型發展下的算力困境。

  另一方面,持續“狂飆”的大模型也引發人們對技術風險的擔憂。

  3月29日,包括馬斯克、馬庫斯、辛頓等在內的千余名科學家和企業高管聯名簽署公開信,呼吁所有人工智慧實驗室立即暫停巨型人工智慧實驗至少6個月,並呼吁建立一套高級人工智慧設計和開發的共用安全協議,讓人工智慧在透明公開、合理有序的軌道上行進。

  馬斯克早前也曾公開表態,強調雖然人工智慧的前景是巨大的,但也帶來了不容忽視的風險,需要稍稍放緩人工智慧的發展速度,加強對其安全問題的監管。本次科學界的共同表態也再次表明,大模型不能一味追求更快、更高、更強,必要時也要踩踩“急剎車”。

  隨著大模型的發展駛入快車道,商業化潛力的釋放將加速大模型在各行各業的應用落地,在走向實體的過程中成為人類強有力的生産力工具,引發更大范圍的顛覆性變革。

來源:2023年5月17日出版的《環球》雜志 第10期

《環球》雜志授權使用,如需轉載,請與本刊聯繫。

更多內容敬請關注《環球》雜志官方微博、微信:“環球雜志”。

手機版