澳大利亞國立大學、牛津大學和北京人工智能研究院的研究人員,合作開發了一種名為“3D-GPT”的新型人工智能系統,該系統可以簡單地根據用戶提供的基于文本的描述生成 3D 模型。相較傳統的 3D 建模工作流,提供了一種更高效直觀的方式來創建 3D 資產。
“為了減少工作量,我們引入了 3D-GPT,這是一種利用大語言模型 (LLM) 進行指令驅動的 3D 建模的框架。在此背景下,3D-GPT 使 LLM 能夠成為熟練的問題解決者,將 3D 建模任務分解為可管理的部分,并為每個部分確定適當的代理?!?/p>
根據介紹,3D-GPT 包括三個關鍵代理:一個解析文本指令的“任務調度代理”,一個添加初始描述中缺失的細節的“概念化代理”,和一個設置參數并生成代碼以驅動 Blender 等 3D軟件的“建模代理”。
借此,3D-GPT 可以實現系統地增強簡潔的初始場景描述,將其演變成復雜的形式,同時根據后續指令動態調整文本。以及無縫集成程序生成,從豐富的文本中提取參數值,輕松與 3D 軟件連接以創建資產。
“我們的實證研究證實,3D-GPT不僅解釋和執行指令,提供可靠的結果,而且還能與人類設計師有效合作。此外,它與 Blender 無縫集成,釋放了擴展的操作可能性。我們的工作凸顯了 LLM 在 3D 建模方面的潛力,為場景生成和動畫的未來進步提供了基本框架?!?/span>
詳情可查看完整論文。