Meta推出SceneScript AI視覺模型,利用可編程語言實時預測建立3D場景
2024-03-26 08:08:19 IT之家3 月 25 日消息,據 Meta 公司官方新聞稿,該公司開發了一款名為“SceneScript”的視覺模型,該模型號稱能夠使用可編程語言來快速“建立”場景,實時推斷房間幾何形狀,并將相關數據轉換為建筑學層面的近似值。
Meta 聲稱,相關方法能夠高效且輕量地建立室內 3D 模型,號稱“只需要數 KB 的內存即可生成清晰且完整的幾何形狀”,并且相關形狀數據具有“可解釋性”,用戶可以輕松閱讀和編輯這些數據表示。
開發人員借鑒了大語言模型“預測單詞”的方法來開發 SceneScript,以 Llama 模型為例,該模型可以根據前面的單詞來預測句子的下一個單詞,例如輸入句子“The cat sat on the…”,模型會預測下一個單詞可能是“mat”或“floor”。而 SceneScript 運用了相同的概念,即通過前序輸入內容推出后文,并使用這些建筑學層面的描述重建出復雜的室內 3D 環境。
免責聲明:本文由作者原創。文章內容系作者個人觀點,轉載目的在于傳遞更多信息,并不代表EETOP贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請及時聯系我們,我們將在第一時間刪除