近日,深度求索(DeepSeek)旗下DeepSeek-R1、V3、Coder等全系列大模型正式接入國家超算互聯網&&。據介紹,DeepSeek-R1專注於自然語言處理,具備強大的文本生成能力;DeepSeek-V3聚焦於圖像生成,能夠生成高分辨率和細節豐富的圖像,適用於廣告、藝術創作等多個場景;DeepSeek-Coder是一款代碼生成模型,能夠協助開發者快速構建程序,提高開發效率。
超算互聯網是以互聯網思維運營超算中心,並連接産業生態中的算力供給、應用開發、運營服務、用戶等各方能力和資源,構建一體化超算算力網絡和服務&&。其目標是緊密連接供需雙方,通過市場化的運營和服務體系,實現算力資源統籌調度,降低超算應用門檻,並帶動計算技術向更高水平發展,推動自主核心軟硬體技術深度應用,輻射帶動自主可控産業生態的發展與成熟。
為促進超算算力一體化運營、打造國家算力底座,國家超算互聯網&&去年4月正式上線,覆蓋科學計算、工業倣真、人工智能(AI)模型訓練等各個領域。
記者從國家超算互聯網&&了解到,截至今年1月,&&上已有各類算力商品超6500款,其中模型服務近240款,既有DeepSeek、Qwen等國內開源大模型,也有Llama、Stable Diffusion、Gemma、Mistral、StarCoder、ChatGLM等國外開源模型。
對於DeepSeek的上線,國家超算互聯網&&相關負責人&&,先進的國産AI技術與國家級綜合算力服務&&融合,是加速國産AI技術生態發展與普及的前沿實踐,其將在市場、技術、創新、産品及用戶方面推動AI技術生態創新及成果落地,促進AI+的多樣化,推動中國乃至全球AI市場的應用落地和産業化進程。通過國家超算互聯網&&,用戶無需本地下載,可在線部署、推理、定制化訓練與開發DeepSeek等國內外知名開源大模型,降低了AI技術使用門檻。與此同時,算力服務的普惠性也得到提升,國家超算互聯網&&依託國産深算智能加速卡與全國一體化算力服務體系,為DeepSeek等模型提供豐富的異構算力資源,為國産AI應用與創新提供持續算力保障。
DeepSeek系列模型在性能上與世界頂尖的大模型不相上下,但在成本上卻具有顯著優勢。DeepSeek系列通過算法優化顯著降低計算資源消耗,結合國家超算互聯網&&“普惠易用、豐富好用”的能力,使得更多企業和用戶能夠負擔得起AI技術的應用,加速AI技術普及。
業界普遍認為,DeepSeek模型在超算互聯網&&的規模化落地,或將改變國內AI行業依賴海外閉源模型的現狀。(記者 楊雪)