
7月2日至5日,2025全球數字經濟大會在京召開。生數科技CEO駱怡航在接受新華網專訪時&&,在Vidu視頻大模型技術發展實踐中發現,AI視頻生成的核心問題是一致性,解決這一問題,就可以滿足多種生産力場景包括廣告、電商、動漫、文旅、影視等的創作需求,實現高效、低成本的規模化生産,加速AI視頻的規模化落地。
新華網:AI視頻技術近期備受關注,但尚未大規模商業化。您認為當前落地難點何在?
駱怡航:視頻模型與語言模型的發展路徑不同。語言模型商業化已快速落地,而視頻模型仍處於商業化早期階段。但實際上部分行業已加速滲透:互聯網領域用戶通過視頻生成實現照片動態化、視頻特效等互動;廣告領域的電商商品介紹已廣泛採用AI生産,甚至電視廣告也在嘗試AI;動漫行業因虛擬製作特性,AI顯著提升了生産效率。文旅、教育、游戲、影視等行業尚未完全滲透,預計未來2-3年,八大行業三十余場景將隨技術發展全面商業化。
新華網:AI生成廣告視頻常面臨主體一致性問題,生數科技Vidu技術是如何實現突破的?
駱怡航:一致性是視頻生成的核心挑戰。早期的文生視頻技術因隨機生成每幀內容而在生産力場景使用極少,圖生視頻需要關鍵幀的圖片來保證連貫性,增加了一個生圖再到圖生視頻的環節,耗時耗力。我們即將發布的“Vidu Q1 參考生”功能首次在業界實現突破:當用戶上傳人物、道具、商品或場景的主體圖片後,生成的每一幀畫面、每個片段乃至多鏡頭切換中,生成視頻的一致性接近100%。這對商業創作具有決定性意義,沒有一致性就無法應用於商業場景。
新華網:“Vidu Q1”模型如何推動商業規模化落地?較之前有何升級?
駱怡航:規模化落地需要同時解決三大維度問題。效果維度,通過參考生視頻技術實現主體一致性與專業級畫面質量;效率維度,支持幾分鐘至幾秒鐘生成5-10秒片段;成本維度,將5秒單片段製作費降至幾毛錢,較傳統方式降低100倍。“Vidu Q1”模型在"好、快、省"三方面同步發力,這是加速商業化進程的核心基礎。
新華網:目前廣告産業仍依賴人工調校,未來AI+廣告需突破哪些瓶頸?
駱怡航:當前AI在精細化人物互動、商品操作等複雜場景尚有局限。“Vidu Q1”模型已解決基礎需求,未來將通過雙重路徑演進:一方面提升基礎模型的智能化能力,另一方面強化廣告場景專項適配能力。值得一提的是,在本次全球數字經濟大會上,我們與亞馬遜雲科技攜手,基於Vidu在數字營銷(廣告營銷)領域的應用合作也入選了北京市人工智能賦能行業發展典型案例(2025),這是雙方在廣告營銷領域的成功實踐,會為廣告行業帶來切實的落地成果。
同時我們預計下半年至明年將在模型迭代及商業化中取得里程碑進展,通過與廣告機構深度合作,吸收場景反饋迭代技術,逐步實現品牌廣告的高複雜度與高精細度要求。
新華網:相比傳統廣告公司,你認為AI如何釋放創意價值?
駱怡航:AI本質是人的"超級助手"。傳統創意常受限於成本與周期,例如宇宙場景需影視級製作才能實現。而AI能以低成本、高效率將創意想象轉化為現實,讓人類創造力獲得更大釋放空間。我們倡導用AI實現更簡單、更快速、更低成本的創意生産。
新華網:生數科技Vidu 目前如何培育AI視頻廣告市場?
駱怡航:我們採取技術迭代與産品滲透雙軌策略。持續升級多模態生成模型的同時,通過“Vidu”APP、SaaS平台、企業API等多形態産品降低使用門檻。針對廣告行業專門開發了運鏡、試穿、商品展示等模板,以“一鍵生成”這樣快速的産品使用方式降低使用門檻,讓技術真正融入千行百業。
新華網:在你看來,傳統企業AI轉型的關鍵策略是什麼?
駱怡航:必須緊扣業務痛點選擇技術方案。企業應以解決場景需求為出發點,避免盲目追求模型指標。我們迭代模型的準則始終是解決産業痛點——AI作為新一輪生産力革命,唯有深入産業激發效率與活力才能實現價值。

