该模型的核心冲破在于立异应用潜在空间并开创同一的3D潜在表示法,将外面光场数据编码为紧凑向量集,经由过程数学描述控制物体物理外形与光线外面交互规律,大年夜幅降低计算成本。

经由过程抽取小部分数据样本,让解码器控制不合光照和视角下的对象还原才能,最终模型实现单张图片猜测三维潜在表示的才能。
其运行采取编码器 - 解码器双向机制,编码器把输入图像的几何构造、视角相干外不雅特点紧缩为潜在空间精简代码,解码器再逆向解压还原3D对象,可精准复现镜面高光、菲涅尔反射等高等光影后果。
苹果研究团队为练习LiTo模型,应用数千个3D对象数据集,在150个不合视角、3种光照前提下完成高强度练习。
在官方比较测试中,LiTo模型严格遵守摄像机坐标系,解决了同类模型生成物体朝向缺点的问题,其多视角光影一致性指标较当前最优的TRELLIS模型晋升约37%。


发表评论 取消回复