國産視頻大模型應用正深入-新華網

　　當前，“人工智能+”服務千行百業。作為人工智能技術應用的最前端，大模型正在為産業發展提供有力支撐。在視頻大模型應用賽道，國産大模型正在深度融入産業。視頻大模型能做什麼？未來發展趨勢怎麼樣？快手人工智能專家接受了採訪。

　　“簡單來説，人工智能大模型就是利用海量數據和巨大算力，通過深度學習算法訓練出來的超大規模人工神經網絡，可以看成是人工智能技術應用的‘能量塊’或‘基礎設施’。”快手高級副總裁、可靈AI事業部負責人兼社區科學線負責人蓋坤説。

　　基於側重不同應用領域，大模型可以分為不同類型。例如DeepSeek是語言大模型，磐石屬於基礎科學大模型，快手可靈則是典型的視頻大模型。各種國産大模型憑藉各自優勢在政務、醫療、教育等領域大顯身手。

　　“可靈作為視頻大模型，服務AI時代的視頻內容創作，致力於推動內容産業邁向智能化、高效率、低門檻。”蓋坤介紹，使用視頻大模型的創作者，可以通過算法驅動生成想拍攝的內容，而不完全依賴攝像鏡頭。

　　視頻大模型用起來、用得好，關鍵在於其生成效果和可控能力。蓋坤舉例説，基於自主研發的高效模型架構以及流匹配算法，快手可靈有效提升了對物理規律的模擬能力，以及對用戶複雜輸入的響應能力，讓角色運動更符合真實邏輯，畫面表現更具時間連貫性與結構完整性。

　　目前，AI視頻生成技術已在廣告、電商、短劇、教育等領域融合應用，幫助提升製作效率、降低成本。蓋坤説，以一部人工智能生成內容（AIGC）短劇為例，快手可靈輔助製作後，整體劇集製作時間大概只相當於傳統製作時間的1/3。視頻生成技術實現真正落地，需要以被市場驗證的真實付費為前提，2025年第二季度可靈收入超過2.5億元，其中近70%由專業創作者貢獻。海外創意&&Freepik接入10個以上全球各地的視頻生成大模型，全球用戶選擇使用快手可靈生成的視頻數量，超過使用其他模型加起來的總和，反映出中國技術團隊在場景理解、用戶體驗等方面的優勢。

　　前不久，《人工智能全球治理行動計劃》發布，強調推動人工智能向善發展、普惠應用。蓋坤&&，目前人工智能視頻生成仍面臨一致性、合理性等技術挑戰，也要警惕版權歸屬、虛假內容傳播等問題。同步提升模型能力與治理能力，不斷完善治理機制，才能讓技術更安全、更可靠地服務産業發展。（劉珈如）

【糾錯】【責任編輯:冉曉寧】

深度觀察

新華全媒頭條丨中國攜手上合夥伴匯聚和平發展力量