夸克AI超級框上新“拍照問夸克” 加碼多模態能力-新華網
新華網 > > 正文
2025 04/27 15:00:47
來源:新華網

夸克AI超級框上新“拍照問夸克” 加碼多模態能力

字體:

  4月27日,夸克AI超級框發布全新AI相機,上新“拍照問夸克”功能。基於視覺理解與思考推理的強大模型能力,夸克AI超級框從視覺出發創新下一代搜索體驗,進一步理解和回答物理世界中的各類問題。作為阿里巴巴AI旗艦應用,夸克AI超級框持續快速迭代,提升超級智能體的多模態能力,打造用戶生活、工作、學習的AI超級入口。

  視覺交互創新,智能分析萬物

  在工作、學習、生活各類場景中,面對複雜物體、表格和圖形時,用戶往往難以準確描述真實需求。全新的夸克AI相機能深入理解用戶意圖,更好地實現視覺搜索、多輪問答、圖像處理與創作。

  基於AI超級框背後的視覺理解和推理模型能力,“拍照問夸克”能在手機和電腦上進行圖片搜索、問答、思考、編輯以及創作。全新的多模態産品入口和交互體驗,讓AI相機成為AI時代用戶表達問題和獲取信息的重要方式。

  “拍照問夸克”能精準識別圖片中的人物、物體和諸多細節,能深入理解用戶需求並聯想相關問題。比如,拍照搜索文物時自動關聯歷史背景,上傳商品圖片時一鍵跳轉淘寶同款鏈結。無論是人物、動物、植物、建築、風景、美食、藝術品、商品、外文資料還是故障代碼,夸克都能做到秒級識別,經過多輪問答和深度思考後,給出同類産品中的最佳回答。

  深入理解意圖,完成複雜任務

  過去,用戶需要切換多個AI工具才能完成圍繞“圖片”的複雜任務。現在,夸克進一步提升“超級Agent”在視覺搜索的産品體驗和使用場景,滿足用戶對現實物理世界的解讀、處理和創作。

  “拍照問夸克”將搜索、掃描、修圖、翻譯、創作等能力聚合為統一入口。針對較為複雜的圖像,用戶可一次上傳10張圖片進行深度推理並完成各類複雜任務。目前,夸克具備超百個專業Agent和原子能力,包括搜索、健康、學習、旅游、商品、創作等,持續通過模型能力升級來優化Agent組合策略,滿足用戶對圖像信息的個性化需求。

  旅行中,“拍照問夸克”化身“專業導游”,邊逛邊拍獲取文物講解、景點攻略;工作中,它能輔助分析數據圖表、優化代碼邏輯,生成工作總結文檔。娛樂場景中,它支持棋牌指導、截圖找劇、情頭配對等趣味功能,並能一鍵完成高清化、去水印、原文溯源等。此外,“拍照問夸克”還支持多種語言提問和翻譯解讀。

  今年3月,夸克發布“AI超級框”並不斷迭代用戶體驗。隨着“拍照問夸克”上線,“AI超級框”在多模態交互上極大拓展了應用場景。分析師認為,夸克通過升級“AI超級框”,從學習到工作、生活全場景覆蓋,多模態功能融合和智能交互創新,精準直擊用戶需求。

  夸克搜索負責人張帆&&:“我們希望通過提升AI超級框的多模態能力,打造用戶與現實物理世界之間的全新交互方式和産品體驗。AI時代,夸克將繼續圍繞信息的獲取、消費、編輯、傳輸、管理、決策和創作,由AI超級框承載更多的需求、更好的交互、更大的能力。”

【糾錯】 【責任編輯:周靖傑】