Project Genie 基于Google此前在 2025 年 8 月向小范围测试者展示的 Genie 3 模型,同时结合了公司自家的 Nano Banana Pro 图像生成模型以及 Gemini 多模态模型,用于将天然说话提示转化为沉浸式互动场景。 用户可以构建的世界类型极为多样,例如操控飞船擦过外星行星、驾驶飞艇飞越上世纪 50 年代风格的欧洲城市,或者让貘在亚马逊雨林深处奔驰等,均可经由过程简单描述或参考照片快速生成。

在具体体验上,Project Genie 会根据玩家若何移动角色、迁移转变视角,及时生成虚拟世界中的画面帧,并支撑与场景内物体的交互以及对情况变更的响应。 例如,在官方演示视频中,一个蓝色小球在白色草地中滚动时,会将它经由的一切都“涂”上蓝色,形成持续变更的轨迹后果;同时,应用还内置了可供用户二次创作和改革的世界模板库,以便快速上手。

用户不仅可以在这些情况中导航,还能上传本身绘制的角色、实际世界物体照片等作为素材,并设定不合元素之间的交互逻辑,从而构建更具个性化的虚拟体验。 在某些场景中,甚至可以看到类似 GPS 导航界面那样的动态反馈:当玩家转向或移动时,界面上的地图也随之更新,加强沉浸感和可玩性。

YouTuber Bilawal Sidhu 在采访 Project Genie 团队成员 Jack Parker-Holder 和 Diego Rivas 时指出,今朝这一体系在实际演示中仍会出现偶发性 Bug,并且每次体验被限制在 60 秒以内,这是当下最大年夜的功能束缚之一。 不过,开辟团队表示,将来会重点摸索如安在用户输入中付与更多对情况和角色行动的控制权,并研究延长虚拟世界持续时光、打破 60 秒上限的可行筹划。

至于应用处景,DeepMind 团队尚未给出单一明白偏向,而是看好它在多个范畴的潜力。 报道指出,Project Genie 有望用于快速原型化电子游戏构思、赞助片子创作者可视化场景与分镜,以及在教室上赞助学生以更具互动感的方法懂得复杂概念或职业场景,例如模仿介入灾后救济工作等,且无需用户具备专业开辟技能。

作者也存眷到,该技巧的开放必定伴随内容安然和合规挑衅,包含若何设置“护栏”防止生成有害或欠妥内容,以及如安在创作过程中规避潜在的版权侵权问题。 Google方面尚未在细节层面周全披露治理机制,但估计会在将来的产品迭代中赓续调剂相干策略。

今朝,栖身在美国且订阅了 Google AI Ultra 的用户已经可以直接经由过程Google实验性项目页面体验 Project Genie。 跟着后续进一步向更多地区和用户开放,这一“用一句话生成并亲自走进虚拟世界”的新型 AI 交互方法,或将成为游戏开辟、创意设计和教导培训等范畴的重要对象之一。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部