“AI‘上車’”的敘事已經平淡、甚至近乎氾濫之際,DeepSeek以異軍突起之姿,強勢“攪動”智駕産業。
1月20日,DeepSeek正式發布DeepSeek-R1模型,並同步開源模型權重。憑藉低廉的成本價格和異常強悍的性能,DeepSeek僅用7天實現用戶增長破億,成為全球現象級的應用。
在多模態方面,DeepSeek於2024年12月發布了用於高級多模態理解的專家混合視覺語言模型——DeepSeek-VL2,模型的視覺問答、光學字符識別、文檔/表格/圖表理解以及視覺定位等能力得到進一步提升。
實際上,在DeepSeek名不見經傳時,産業界已經關注到了其旗下模型,部分自動駕駛公司已開始提前探索該模型的應用潛力。
“效果超出預期!我們今年初在內部進行了實際測試,DeepSeek最直觀的變化就是對模型訓練效率的提升,它可以將推理響應時間縮短40%,甚至50%,同時算力利用率也有一定的下降。”一位某智駕龍頭企業高管透露説。
在業內看來,DeepSeek作為開源基礎模型,有望加速智能駕駛的訓練速度,降低智能駕駛的訓練成本,成為智駕訓練的重要工具。
就智駕系統的開發而言,知行汽車科技系統總監張偉分析稱,複雜城區場景是當前開發難度最大的地方,依賴傳統的感知模型很難去解決此類長尾場景。各個企業都在嘗試開發訓練VLM模型(視覺語言模型),以優化系統對長尾場景的檢測及處理能力。
但開發這樣一套系統,依賴極大的雲端算力及數據訓練成本,部署到車端的模型也要依賴較大算力的硬體&&。而DeepSeek通過其獨特的技術優勢,例如MoE(混合專家架構)、GRPO(群組相對策略優化)、MLA(多頭潛在注意力機制)等,可以更好賦能智駕系統開發。
“一言以蔽之,DeepSeek有助於以更少的數據和訓練成本,實現同等性能的城市自動駕駛功能。”張偉説。
具體來看,在雲端訓練環節,用於自動駕駛模型訓練的數據,要經過標注後才能進行模型訓練,最後才得到能夠識別車輛和行人的深度學習模型。DeepSeek本身降低了對數據標注的需求,因此可以幫助智駕企業進行數據挖掘和生成,降低數採和標注的成本。
在車端,DeepSeek可以通過蒸餾提升模型能力,降低車端計算資源需求,並降低車端部署成本。模型單次調用算力需求和訓練成本都因此大大降低。
在場景理解上,張偉認為,跨模態遷移後DeepSeek邏輯性與場景理解力更強,在極端路況(如斷頭路、罕見交通標誌識別、突發道路施工等)的表現有望優於傳統模型。黑芝麻智能CMO(首席市場營銷官)楊宇欣同樣&&,未來DeepSeek可以用於融合視覺、語音、環境等多維度數據,實現更擬人化的駕駛決策,例如在複雜路口動態調整路徑規劃,或在突發狀況中快速生成安全策略。
楊宇欣認為,DeepSeek等大模型的核心價值在於通過端側高效推理能力,推動智能駕駛系統從“感知驅動”向“認知驅動”升級。若DeepSeek能通過低成本算力芯片實現規模化應用,將加速智駕功能向大眾市場滲透。(記者 孫小程 李興彩)