百度宣布新升級:實現AI長視頻實時交互 上線8種模態創作能力 -新華網
新華網 > > 正文
2025 10/15 15:57:58
來源:新華網

百度宣布新升級:實現AI長視頻實時交互 上線8種模態創作能力 

字體:

  10月15日,百度搜索宣布全面升級文心助手AIGC創作能力,支持AI圖片、AI視頻、AI音樂、AI播客等8種模態創作,且能夠一鍵調用多工具解決多場景問題。此外,百度搜索還發布行業首個開放式實時互動的數字人智能體。

  同日,視頻生成模型百度蒸汽機(文心專精)再次升級。該模型突破傳統AI視頻生成10秒左右的時長限制,實現AI長視頻實時交互生成。

  文心助手上線8種模態創作能力

  據百度搜索相關負責人介紹,百度搜索文心助手在任務解決、創作生成能力等方面進一步升級。在任務解決方面,升級後的文心助手支持一鍵調用多工具,解決生活、健康、教育、工作等多場景問題。在內容創作領域,文心助手已經支持AI圖片、AI視頻、AI音樂、AI播客等8種模態創作能力。截至目前,每天都有千萬量級的AIGC內容由用戶通過文心助手創作産生。

  例如,文心助手的長視頻生成玩法,輸入一段話,即可創作一部 3 分鐘的故事大片。同時,文心助手還集成“一句話寫歌”“MV製作”“名場面模仿秀”等創作功能,以及超30種特效玩法模板,後續還將上線音樂數字人分身功能,覆蓋從圖片處理到視頻製作的多元創作需求。

  蒸汽機模型實現AI長視頻實時交互

  百度蒸汽機再次升級,實現AI長視頻實時交互生成。該功能升級依託流式視頻技術實現“無限時長”生成,突破傳統AI視頻生成10秒左右的時長限制。

  據了解,用戶只需上傳單張圖片與一段提示詞即可啟動視頻生成流程,並能實時預覽模型推理全部內容。在生成過程中,用戶可隨時暫停或在任意節點修改提示詞,實現對視頻劇情、畫面、轉場的實時控制,全程干預。這意味着,AI視頻從“單向生成”邁向“雙向共創”,實現“無限畫布”式的連續創作體驗。

  此外,此次升級同步推出了可交互數字人與開放世界動態構建兩大功能。數字人支持沉浸式雙向互動,可應用於AI導購、教育、陪伴等場景;開放世界則允許用戶通過自行操控,在AI生成的游戲地圖、旅游景點、宇宙空間等環境中自由探索。

【糾錯】 【責任編輯:冉曉寧】