火山引擎發布豆包大模型1.8和音視頻創作模型Seedance 1.5 pro-新華網

12月18日，火山引擎在FORCE原動力大會上正式發布豆包大模型1.8及音視頻創作模型Seedance 1.5 pro。權威評測數據顯示，豆包大模型在多模態理解、生成能力及Agent能力上，已躋身全球第一梯隊。

據火山引擎總裁譚待介紹，截至今年12月，豆包大模型日均token使用量突破50萬億，較去年同期增長超過10倍；目前已有超過100家企業客戶累計token使用量超過一萬億。

火山引擎總裁譚待

豆包大模型1.8：打造更強多模態Agent“大腦”

作為豆包家族的最新旗艦模型，豆包大模型1.8（Doubao-Seed-1.8）面向多模態Agent場景進行了定向優化。其工具調用能力、複雜指令遵循能力及OS Agent能力均得到增強，提升了模型在處理複雜任務時的規劃與執行水平。

在視覺理解方面，豆包1.8的單次視頻理解幀數從640幀倍增至1280幀。模型支持以低幀率理解超長視頻，並能調用工具對關鍵片段進行高幀率理解。該能力可廣泛用於在線教育、産品質檢等場景中。

豆包大模型1.8測試表現

在多項公開評測中，豆包1.8展現出極具競爭力的全面表現：在視覺推理、通用視覺問答、空間理解及視頻理解等任務中，均獲得最佳或接近最佳成績；在通用智能體測評集BrowserComp上表現全球領先；在數學與推理等基礎能力維度上，整體水平已接近全球頂尖的通用模型。

Seedance 1.5 pro：音畫高精同步，重塑AI視頻生産力

針對日益增長的視頻創作需求，火山引擎推出了Seedance 1.5 pro音視頻創作模型。該模型不僅具備影視級的敘事張力，能夠精準捕捉運動細節並細膩呈現人物情緒，更在音畫同步技術上取得了突破性進展。

Seedance 1.5 pro採用創新的原生音視頻聯合生成架構，支持環境音、背景音樂、人聲等多種元素，實現了毫秒級的音畫同步輸出。在對白處理上，模型支持多人多語言對話，口型對齊精準，覆蓋中文方言（如四川話、粵語等）、英文及小語種，極大地提升了視頻內容的真實感與全球化創作潛力。

為進一步降低創作門檻與成本，Seedance系列即將上線“Draft樣片”功能。創作者可先生成低分辨率樣片進行預覽，其關鍵要素與最終成片高度一致，真正做到“預覽即所得”。數據顯示，該功能可幫助創作者提升65%的整體效率，並減少60%的無效創作成本。

目前，個人用戶已可在豆包、即夢AI等平台體驗該模型；企業用戶則可從12月23日起，通過火山引擎API接入Seedance 1.5 pro模型服務。

升級AI雲原生架構，構建Agent規模化落地基座

譚待指出，傳統的IT架構已無法滿足Agent時代的需求，以模型為中心的AI雲原生架構正在形成，並圍繞Agent的開發與運營進行重構。

在Agent開發層面，火山引擎全面升級了企業級AI Agent平台——AgentKit。該平台覆蓋了Agent從開發、部署到管控的全生命周期，旨在解決企業在Agent落地中面臨的身份權限管理、模型確定性及系統集成等核心挑戰。

在Agent運營層面，火山引擎推出了HiAgent智能體工作站。該工作站通過構建統一的企業AI任務調度中心、提供一系列開箱即用的通用智能體，以及支持個性化定制智能體應用，幫助企業實現Agent的規模化管理與應用。

此外，為降低企業使用門檻，火山引擎推出了“AI節省計劃”。該計劃覆蓋所有按量後付費的大模型産品，通過階梯式折扣，幫助企業最高節省47%的成本。

譚待&&，通過從模型能力到基礎設施的全面革新，火山引擎正在推動AI應用從單一的模型調用向複雜的Agent智能體生態演進，加速AI能力在各行各業的深度落地。

【糾錯】【責任編輯:周靖傑】