火山引擎發布豆包大模型1.8和音視頻創作模型Seedance 1.5 pro-新華網
新華網 > > 正文
2025 12/19 16:05:03
來源:新華網

火山引擎發布豆包大模型1.8和音視頻創作模型Seedance 1.5 pro

字體:

  12月18日,火山引擎在FORCE原動力大會上正式發布豆包大模型1.8及音視頻創作模型Seedance 1.5 pro。權威評測數據顯示,豆包大模型在多模態理解、生成能力及Agent能力上,已躋身全球第一梯隊。

  據火山引擎總裁譚待介紹,截至今年12月,豆包大模型日均token使用量突破50萬億,較去年同期增長超過10倍;目前已有超過100家企業客戶累計token使用量超過一萬億。

火山引擎總裁 譚待

  豆包大模型1.8:打造更強多模態Agent“大腦”

  作為豆包家族的最新旗艦模型,豆包大模型1.8(Doubao-Seed-1.8)面向多模態Agent場景進行了定向優化。其工具調用能力、複雜指令遵循能力及OS Agent能力均得到增強,提升了模型在處理複雜任務時的規劃與執行水平。

  在視覺理解方面,豆包1.8的單次視頻理解幀數從640幀倍增至1280幀。模型支持以低幀率理解超長視頻,並能調用工具對關鍵片段進行高幀率理解。該能力可廣泛用於在線教育、産品質檢等場景中。

豆包大模型1.8測試表現

  在多項公開評測中,豆包1.8展現出極具競爭力的全面表現:在視覺推理、通用視覺問答、空間理解及視頻理解等任務中,均獲得最佳或接近最佳成績;在通用智能體測評集BrowserComp上表現全球領先;在數學與推理等基礎能力維度上,整體水平已接近全球頂尖的通用模型。

  Seedance 1.5 pro:音畫高精同步,重塑AI視頻生産力

  針對日益增長的視頻創作需求,火山引擎推出了Seedance 1.5 pro音視頻創作模型。該模型不僅具備影視級的敘事張力,能夠精準捕捉運動細節並細膩呈現人物情緒,更在音畫同步技術上取得了突破性進展。

  Seedance 1.5 pro採用創新的原生音視頻聯合生成架構,支持環境音、背景音樂、人聲等多種元素,實現了毫秒級的音畫同步輸出。在對白處理上,模型支持多人多語言對話,口型對齊精準,覆蓋中文方言(如四川話、粵語等)、英文及小語種,極大地提升了視頻內容的真實感與全球化創作潛力。

  為進一步降低創作門檻與成本,Seedance系列即將上線“Draft樣片”功能。創作者可先生成低分辨率樣片進行預覽,其關鍵要素與最終成片高度一致,真正做到“預覽即所得”。數據顯示,該功能可幫助創作者提升65%的整體效率,並減少60%的無效創作成本。

  目前,個人用戶已可在豆包、即夢AI等平台體驗該模型;企業用戶則可從12月23日起,通過火山引擎API接入Seedance 1.5 pro模型服務。

  升級AI雲原生架構,構建Agent規模化落地基座

  譚待指出,傳統的IT架構已無法滿足Agent時代的需求,以模型為中心的AI雲原生架構正在形成,並圍繞Agent的開發與運營進行重構。

  在Agent開發層面,火山引擎全面升級了企業級AI Agent平台——AgentKit。該平台覆蓋了Agent從開發、部署到管控的全生命周期,旨在解決企業在Agent落地中面臨的身份權限管理、模型確定性及系統集成等核心挑戰。

  在Agent運營層面,火山引擎推出了HiAgent智能體工作站。該工作站通過構建統一的企業AI任務調度中心、提供一系列開箱即用的通用智能體,以及支持個性化定制智能體應用,幫助企業實現Agent的規模化管理與應用。

  此外,為降低企業使用門檻,火山引擎推出了“AI節省計劃”。該計劃覆蓋所有按量後付費的大模型産品,通過階梯式折扣,幫助企業最高節省47%的成本。

  譚待&&,通過從模型能力到基礎設施的全面革新,火山引擎正在推動AI應用從單一的模型調用向複雜的Agent智能體生態演進,加速AI能力在各行各業的深度落地。

【糾錯】 【責任編輯:周靖傑】