谷歌發布基礎世界模型Genie 能一圖創建互動的虛擬環境-新華網

　　據谷歌公司官網26日報道，谷歌旗下“深度思維”公司重磅發布了一個根據互聯網視頻訓練的基礎世界模型——Genie（精靈）。其可從合成圖像、照片、草圖生成多種動作可控的環境。

Genie效果的動圖截圖演示。圖片來源：谷歌官網

　　過去幾年，生成式人工智能（AI）模型能通過語言、圖像甚至視頻生成內容。谷歌此次引入生成式人工智能新範式，即生成式交互式環境，通過單個圖像提示即可生成交互式、動作可控的環境。

　　Genie是一個110億參數的基礎世界模型，在超過20萬小時的二維（2D）游戲視頻上進行訓練，無需人工監督。這意味着Genie可以從視頻中自行識別不同動作的特徵和模式。其能學習各種角色的動作、控制和行動。

　　Genie的獨特之處還在於它能夠專門從互聯網視頻中學習細顆粒度的控制。Genie不僅能觀察哪些部分是可控制的，而且能根據生成的環境來推測出多種潛在的動作。

　　該模型接受單個圖像（無論是AI合成圖像、照片還是草圖），並將其轉換為可玩的游戲，響應用戶控件。從圖像到基本的交互環境一步到位。

　　用戶只需提供一張紙上的草圖、一幅完美的數字藝術作品，甚至是AI生成對2D世界的描述，Genie就會完成剩下的工作，幫用戶生成2D游戲。

　　谷歌官網稱，Genie專注2D&&游戲和機器人技術的視頻，但方法通用，應適用於任何類型領域並可擴展至更大的互聯網數據集。只需一張圖像就能創建全新的交互環境，這為生成和進入虛擬世界的各種新路徑開啟了大門。（記者張夢然）

【糾錯】【責任編輯:朱家齊】