網路巨擘 Google 旗下的人工智慧公司 Google DeepMind 日前發表了一種全新 AI 人工智慧生成工具「Genie 2」,能透過 AI 從單一圖像產生出可以讓使用者即時操控角色進行探索與互動的 3D 環境。
Genie 2 是一種大規模基礎世界模型,能基於單一提示圖像產生無數種可操作、可遊玩的 3D 環境。用於訓練和評估虛擬助理,協助藝術家或設計師快速製作原型,引導環境設計的創意過程,進一步加速研究。
Genie 2 可以透過使用者輸入的提示圖像來產生出對應主題的虛擬世界並動態模擬,即時呈現出各種行動的結果,如跳躍、游泳等。具備建模、複雜角色動畫、物件互動、物理模擬、預測其他 AI 代理行為的能力。
Genie 2 能從提示圖像中正確辨識出主體角色,即時回應鍵盤按鍵輸入所採取的動作,並依照操作輸入從當下畫格中即時產生出無數種軌跡變化的影像。過程中會記錄下所有先前產生過、但當下已經不可見的場景,以便在回頭探索時能一致重現,最長可以產生出 1 分鐘保持一致主題的世界,還能以不同的視角呈現。
Genie 2 能識別 3D 結構並產生複雜的 3D 視覺場景。能模擬各種物件的互動,如氣球爆裂、開門或是點燃炸藥桶等。能替執行不同活動的各種類型角色製作對應的動畫。能建立其他 AI 代理(NPC)的模型甚至與之進行複雜的互動。能提供物理模擬效果,像是水體、煙霧、重力、光照、反射、泛光、彩色照明等。
更多資訊可參考 Google DeepMind 官方部落格介紹: