國産視頻大模型應用正深入-新華網
新華網 > > 正文
2025 09/01 07:43:47
來源:人民日報

國産視頻大模型應用正深入

字體:

  當前,“人工智能+”服務千行百業。作為人工智能技術應用的最前端,大模型正在為産業發展提供有力支撐。在視頻大模型應用賽道,國産大模型正在深度融入産業。視頻大模型能做什麼?未來發展趨勢怎麼樣?快手人工智能專家接受了採訪。

  “簡單來説,人工智能大模型就是利用海量數據和巨大算力,通過深度學習算法訓練出來的超大規模人工神經網絡,可以看成是人工智能技術應用的‘能量塊’或‘基礎設施’。”快手高級副總裁、可靈AI事業部負責人兼社區科學線負責人蓋坤説。

  基於側重不同應用領域,大模型可以分為不同類型。例如DeepSeek是語言大模型,磐石屬於基礎科學大模型,快手可靈則是典型的視頻大模型。各種國産大模型憑藉各自優勢在政務、醫療、教育等領域大顯身手。

  “可靈作為視頻大模型,服務AI時代的視頻內容創作,致力於推動內容産業邁向智能化、高效率、低門檻。”蓋坤介紹,使用視頻大模型的創作者,可以通過算法驅動生成想拍攝的內容,而不完全依賴攝像鏡頭。

  視頻大模型用起來、用得好,關鍵在於其生成效果和可控能力。蓋坤舉例説,基於自主研發的高效模型架構以及流匹配算法,快手可靈有效提升了對物理規律的模擬能力,以及對用戶複雜輸入的響應能力,讓角色運動更符合真實邏輯,畫面表現更具時間連貫性與結構完整性。

  目前,AI視頻生成技術已在廣告、電商、短劇、教育等領域融合應用,幫助提升製作效率、降低成本。蓋坤説,以一部人工智能生成內容(AIGC)短劇為例,快手可靈輔助製作後,整體劇集製作時間大概只相當於傳統製作時間的1/3。視頻生成技術實現真正落地,需要以被市場驗證的真實付費為前提,2025年第二季度可靈收入超過2.5億元,其中近70%由專業創作者貢獻。海外創意&&Freepik接入10個以上全球各地的視頻生成大模型,全球用戶選擇使用快手可靈生成的視頻數量,超過使用其他模型加起來的總和,反映出中國技術團隊在場景理解、用戶體驗等方面的優勢。

  前不久,《人工智能全球治理行動計劃》發布,強調推動人工智能向善發展、普惠應用。蓋坤&&,目前人工智能視頻生成仍面臨一致性、合理性等技術挑戰,也要警惕版權歸屬、虛假內容傳播等問題。同步提升模型能力與治理能力,不斷完善治理機制,才能讓技術更安全、更可靠地服務産業發展。(劉珈如)

【糾錯】 【責任編輯:冉曉寧】