简体
  • 简体中文
  • 繁体中文

热门资讯> 正文

中金前沿论文导读:元宇宙复兴的信号?Instruct-NeRF2NeRF & Pix2Pix三维领航

2023-04-14 07:35

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

Abstract

摘要

AI赋能下,3D内容生产实现增效降本,有望推动行业应用的发展。效率低、成本高是过往制约3D内容生产的核心问题。我们认为成本和应用门槛的下降,有望促进3D内容在游戏、电商、虚拟人、MR和XR等领域的持续渗透,逐步使得普通消费者可以直接参与到3D内容的创作和消费中。

技术进展不及预期,行业竞争加剧,商业化落地节奏不及预期。

Instruct NeRF-2-NeRF简介

► 虚拟现实和增强现实:Instruct-NeRF2NeRF可用于为增强现实和虚拟现实应用创建虚拟世界。例如,Instruct-NeRF2NeRF可以用来创建一个用户家中某个房间的虚拟世界,然后用户可以使用增强现实技术将虚拟世界中的物体投影到真实世界中。

► 三维建模:Instruct-NeRF2NeRF可以用来创建物体或场景的三维模型。例如,用户可以使用Instruct-NeRF2NeRF创建一个汽车的3D模型,然后可以用这个3D模型为用户的汽车创建一个虚拟展厅。

► 动画:Instruct-NeRF2NeRF可以用来创建物体或场景的动画。例如,用户可以使用Instruct-NeRF2NeRF创建一个球正在弹跳的动画,然后用户可以用这个动画来创建一个视频游戏。

► 艺术:Instruct-NeRF2NeRF可以用来实现艺术体验,如绘画或雕塑。例如,用户可以用Instruct-NeRF2NeRF创造一幅风景画,然后可以用这幅画创造一个虚拟现实体验。

图表1:通过输入文字,即可实现用自然语言修改3D模型

资料来源:Instruct-NeRF2NeRF官方Blog,中金公司研究部

资料来源:Instruct-NeRF2NeRF官方Blog,中金公司研究部

什么是NeRF?

NeRF (Neural Radiance Fields) 是一种新颖的AI技术,用于将2D图像合成高质量的3D场景。它的基本思想是将3D场景表示为一个连续的、可微分的函数,再由该函数将3D坐标映射到颜色和密度值。该函数使用神经网络建模,通过神经网络从不同视角捕捉场景的2D图像,并在这一数据集上进行训练从而实现对3D场景的重建。

NeRF的关键创新在于使用辐射场来隐式表示场景,有别于传统三维重建将场景表示为网格等显式表达。辐射场是一个将3D点和观察方向映射到该点在该方向上发出的辐射(颜色和亮度)的函数。基于这一函数,NeRF可以从任意视角生成高质量且逼真的3D场景图像。

训练NeRF 模型需要从不同视角的场景中收集大量的2D图像。这些图像用于估计摄像机的位置,并使用结构从运动技术中提取深度信息。然后,所提取的深度信息用于生成训练数据,包括3D点和与之相应的RGB值。在输入这些数据后,该神经网络经过训练从而能够预测场景中任何3D点的辐射值。

在推断期间,NeRF接收观察方向作为输入,并生成相应的场景图像。为了生成图像,NeRF 需要先从摄像机位置向场景采样一组光线。对于每条光线,NeRF使用神经网络估计沿光线的一组点的辐射值,然后将估计的辐射值沿着光线积分,从而计算相应像素在输出图像中的最终值。

NeRF有许多潜在的应用领域,包括虚拟和增强现实、计算机图形学和机器人技术。例如,NeRF可用于生成难以或不可能使用传统成像技术捕捉的场景的逼真图像,如具有复杂照明或遮挡的场景。此外,NeRF也可以基于少量的2D图像集生成复杂的3D场景,从而在机器人技术和自主导航中有所应用。

英伟达的开源NeRF技术

Nvidia的Instant-NeRF是一个加速NeRF训练和推理的开源库。它基于NeRF的基本思想,使用深度神经网络对辐射场进行建模,并使用渐进式渲染技术生成高质量的3D场景。与传统NeRF不同,Instant-NeRF使用Fourier Featurization技术,将位置和方向信息嵌入到神经网络的隐藏层中,从而显著减少了网络的参数数量和计算成本,实现了实时渲染效果。

Instant-NeRF的开源使得该算法可以广泛地应用于计算机图形学、增强现实和虚拟现实等领域。此外,Instant-NeRF 还支持对不同类型数据集进行训练和推理,由此提高其对各种应用场景的适用性。由于其高效和高质量的渲染结果,Instant-NeRF在游戏开发、影视制作和工业设计等领域均具有广泛的应用前景。

开源使得任何人都可以访问并使用Instant-NeRF。英伟达的Instant-NeRF是非商用的,使用的是Nvidia Source Code License-NC。开放的开发模式下,研究人员和开发人员可以依据自身需求,自由地修改和扩展Instant-NeRF,从而促进了NeRF技术的发展和普及,使更多人能够受益于这项重要的技术进步。

图表2:英伟达开源的Instant-NeRF只需要几张照片便可以构建出3D场景

资料来源:Nidia Tech Blog,中金公司研究部

资料来源:Nidia Tech Blog,中金公司研究部

图表3:Instant-NeRF算法以3D方式重现Andy Warhol公布拍立得相片的经典时刻

资料来源:英伟达官网,中金公司研究部

资料来源:英伟达官网,中金公司研究部

什么是Instruct-Pix2Pix?

图表4:用Instruct-Pix2Pix 以自然语言修改图片:在湖面上加上船,或者将群山换为城市

资料来源:Instruct-Pix2Pix 官方Blog,中金公司研究部

资料来源:Instruct-Pix2Pix 官方Blog,中金公司研究部

图表5:用Instruct-Pix2Pix 以自然语言修改图片:将人类换成机器人

资料来源:Instruct-Pix2Pix 官方Blog,中金公司研究部

资料来源:Instruct-Pix2Pix 官方Blog,中金公司研究部

Instruct-NeRF2NeRF模型的局限性

Instruct-NeRF2NeRF为将NeRF与Instruct-Pix2Pix结合所产生的模型,因此延续了Instruct-Pix2Pix的诸多局限:不能更改视角或空间布局;不能对图片做太大的变换;难以单独分离物体。

本文摘自:2023年4月13日已经发布的《中金前沿论文导读:元宇宙复兴的信号?Instruct-NeRF2NeRF & Pix2Pix三维领航》

于钟海  分析员 SAC 执证编号:S0080518070011 SFC CE Ref:BOP246

王之昊  分析员 SAC 执证编号:S0080522050001 SFC CE Ref:BSS168

魏鹳霏  联系人 SAC 执证编号:S0080121070252 SFC CE Ref:BSX734

风险及免责提示:以上内容仅代表作者的个人立场和观点,不代表华盛的任何立场,华盛亦无法证实上述内容的真实性、准确性和原创性。投资者在做出任何投资决定前,应结合自身情况,考虑投资产品的风险。必要时,请咨询专业投资顾问的意见。华盛不提供任何投资建议,对此亦不做任何承诺和保证。