Skip to content

Archive

Tag: GS
2011年,我曾经写过一篇《不争气的geometry shader》,里面比较了在当年的多个平台上跑多种 render to cubemap的方法。经过帧数的对比,得出的结论是geometry shader会造成严重性能问题,甚至还不如渲染6遍的结果。2012年,同样的测试在GTX 580和GTX 680上重新跑了一遍,发现GTX 680上geometry shader终于比渲染6遍更快。 到了2019年,情况又会有什么变化呢?我们再来跑一次。说是2019年,其实我的电脑是2015年配的,Intel i7-4790的CPU,NV GTX 960的GPU。系统是Win10 19H1。但因为GTX 960和D3D 11.4支持在GS之前的stage输出SV_RenderTargetArrayIndex,我们其实不需要GS也能render to cubemap或者render to texture array。所以我们需 ...
上周末实现了打算在KlayGE 4.0中使用的render to texture array功能。于是自然而然想到在ShadowCubeMap这个例子中使用,用来在1个pass内直接生成cubemap。结果,不比不知道,一比吓一跳。在不同GPU上FPS如下: NV 9800GT NV 480GTX AMD 5870 6 pass Cubemap 158.63 312.82 241.10 Dual Paraboloid 5.77 375.32 211.91 1 pass Cubemap 66.08 288.77 228.44 1 pass Cubemap with instance 105.37 281.34 224.10 1 pass Cubemap with instance GS NA 287.80 211.01 9800GT所在机器的CPU比后两套系统差得多,没法横向比较,只能纵向比较。后两套系统只有GPU不同,可以横向和纵向比较 ...