新華網北京5月17日電(記者凌紀偉)隨着AI向終端下沉,端側AI讓智能變得觸手可及。怎樣看待端側AI發展趨勢,端側AI在“人人可享的AI未來”願景中為何發揮關鍵作用?新華網就此專訪教育部長江學者、北京郵電大學網絡與交換技術全國重點實驗室喬秀全教授。
喬秀全&&,大模型技術深刻影響生産生活,但大模型又是一個非常耗費資源的産品,如果都放在雲端計算或者推理,那麼它對算力資源的消耗比較大,對網絡帶寬、雲端算力資源的影響也比較大。隨着邊緣計算、邊緣智能的崛起,終端設備算力表現越來越強。現在一部智能手機相當於原來一台服務器的算力水平,所以現在終端設備也能支撐相關的AI算法,特別是一些幾十億參數規模的這種小參數的大模型也可以在終端上運行。
“針對一些特定的應用場景,可以實現終端AI模型在本地就能運行推理,回答相關的一些問題,做一些相關的計算。所以我覺得端側AI是未來的一個發展趨勢。”喬秀全説。
談到端側AI的獨特優勢,喬秀全認為,首先是數據的安全性,原來需要把數據傳輸到雲端去處理,現在用戶的數據可以在端側處理。其次是響應速度,在終端運行AI能夠快速響應用戶需求,降低傳輸時延。另外,如果大量的用戶請求傳輸到雲端,雲端將出現併發壓力,導致排隊,而在終端處理就能夠降低雲端壓力。
當前,端側AI賦能越來越多的終端産品,終端的産品形態也越來越多樣化。“比如AI賦能的可穿戴設備,它們的交互方式將更加自然,未來終端的樣式也會越來越多,智能家居、智能音箱、智能電視,都可以被AI賦能。特別是機器人,未來每個家庭都會有一個服務型的機器人,通過一些小參數的大模型可以讓人與機器人的交互更加便捷。”喬秀全認為,未來可以把大模型壓縮之後,形成各種垂直類小模型來為用戶的終端賦能。
喬秀全十分看好AI和XR終端的結合,認為這是未來的一個大趨勢。“AI賦能的終端越來越輕量化,特別是我們佩戴一個輕量化的AR眼鏡之後,它就可以在前端實時地做一些計算,比如説實時翻譯,提供一種跨語言的實時交流,讓溝通交流無障礙。”
圍繞端側計算,特別是讓AI能力在終端側能夠真正應用起來,喬秀全帶領團隊投身WebXR研究數年。“應用AI算法,在前端利用網頁就可去追蹤一個圖片,再把虛擬信息,如視頻或者3D模型疊加上去,就可以在文化旅游等各種各樣的場景廣泛應用起來。”喬秀全説,目前團隊已將WebXR技術與5G消息結合起來,當來到一個城市,用戶手機上會收到一條5G消息,打開它就可以沉浸式地利用WebXR技術體驗當地優秀的傳統文化和名勝古跡。
沉浸式通信已被ITU列為6G的一個主要應用場景,沉浸式通信時代,各種平面視頻、文本、圖像,將向沉浸式空間計算方向發展,未來物理世界和虛擬世界的信息能夠無縫地融合在一起。
“我們現在正在開發全息實時通信技術,或者叫體積視頻的實時傳輸、實時通信,只要一個人在這個採集環境下,實時採集完成之後實時傳輸,到了接收端再實時重建。這對帶寬要求非常高,需要用到一些端側AI的算法。”喬秀全介紹説,這個過程不是將視頻都壓縮之後再去傳輸,而是提取關鍵的核心語義特徵點之後再傳到遠端,然後遠端再利用AI的算法來重建,只有這樣才能實現更好的通信,通過端側AI計算來換通信帶寬,這是目前面向6G的語義通信的重要研究內容。
喬秀全認為,端側AI讓普通用戶通過日常使用的終端就可以享受到AI帶來的技術紅利。無論是圍繞工作還是生活,端側AI的規模化應用時代已經開啟,未來它的應用場景和範圍會越來越廣泛。