Mega Geometry为构建BVH提供了一种新的算法,它将三角形集群作为基础元素,构建出新的聚类加速结构(Cluster-level Acceleration Structures,CLAS),新结构可以按需生成,并最多可以生成256个三角形批次,然后CLAS集合再被用作输入构建BVH。由于每个CLAS代表大约100个三角形集合,依照VLAS构建的BVH的处理量减少了两个数量级,从而允许游戏引擎在每一帧游戏画面中,可以拥有更多的预算进行更多的BVH构建。
Mega Geometry中的分区顶层加速结构(PartitionedTop-Level Acceleration Structure,PTLAS)
细分曲面
Mega Geometry的主要目标之一是让光线追踪与现代游戏引擎的细节层次系统无缝结合,但应用范围也不限于如此。由于可以灵活的基于GPU完成聚类生成、快速构建BVH,更多高阶的几何技术也可以付诸实践,包括细分曲面。
细分曲面是一种集合表现方式,在电影和生产渲染工作流程中使用较为普遍。例如在1978年被提出的经典Catmull-Clark细分规则对于四边形网络迭代细化,通过位移贴图,获得平滑的渲染表面,使得粗糙的多边形网格细化成光滑的曲面。
细分曲面的光线追踪通过三角化的方式实现,对于动画或者视点变化,每一帧如果都需要重新创建新的细分曲面,会产生大量的BVH需求降低效率。Mega Geometry可以将细分曲面过程直接映射到聚类生成上,从生成的CLAS中快速构建BVH,从而获得更快的实时性能。
在Blackwell Max-Q中主要做了三项改进,分别是:高阶电源门控(Advanced Power Gating),加速频率切换(Accelerated Frequency Switching),低延迟睡眠(Low Latency Sleep)。
高阶电源门控(Advanced Power Gating)
从活跃电源状态切换到深度电源状态的问题在于,电源状态越深,那么进入和退出这个状态所需的时间越长。Blackwell减少了进入和退出不同电源状态的延迟,NVIDIA将其称为迄今为止他们所构建的最先进的芯片单元电源门控技术,使用多个新的门控层级,允许电源进行非常细微的调控。
加速频率切换(Accelerated Frequency Switching)
加速频率切换是近十年来最大规模的时钟架构升级,这个升级可以让时钟比以前GPU架构快1000倍的调整工作负载,使得Blackwell能够快速响应GPU工作负载的动态特性。根据工作负载的调整时钟速度,以获得最佳性能和功耗效率,而不是像此前时钟频率在整个帧生成的过程中保持不变。
同时Transformer还具有更好的扩展性,可以让DLSS 4处理2倍的参数模型,利用更多的Tensor Core计算能力,重建更高质量的图像。这套解决方案适用于所有GeForce RTX用户,而不是仅限定在GeForce RTX 50系列用户中。
DLSS超分辨率(DLSS Super Resolution,DLSS-SR)
DLSS超分辨率通过AI降低分辨率输入,并输出高分辨率来获得性能提升。DLSS通过采样多张分辨率图像,并利用运动数据和前一帧来构建高质量图像。与之前DLSS-SR相比,Transformer模型在时间稳定性上表现更好,因此新的DLSS-SR减少了鬼影,且运动中的图像细节更丰富,抗锯齿效果也得到了改善。
DLSS光线重建(DLSS Ray Reconstruction,DLSS-RR)
DLSS-RR利用AI为复杂光线追踪场景额外生成像素来提升图像质量。DLSS-RR通过NVIDIA超算训练的AI网络代替手工调教的降噪器,通过网络采样光线之间生成更高质量的像素。特别是在复杂光线追踪场景中,DLSS-RR依靠Transformer模型在质量上获得了很大的提升,伪影得到了显著改善。