高质量图像放缩

Aug 14

转载请注明出处为KlayGE游戏引擎，本文的永久链接为http://www.klayge.org/?p=2592

在渲染场景的时候，一般来说分辨率和输出大小，也就是窗口大小相同。但在移动平台上，基本上没机会让你随便切换分辨率，都是只告诉你大小。在这时候，你如果想要用特定的分辨率渲染，就不可避免需要一次放缩。另一个常见的情况是，如果一个平台性能达不到需要的帧速率，也需要渲染较小的图之后，拉伸到指定分辨率。在XBox 360等console平台，有个专门的硬件放缩机制，只要打开就能自动把输入图像拉伸到720p或1080i/p（DX11.2才开始引入这样的机制）。但在PC和移动平台上，这个事情得在引擎里自己完成。所以在post process后端，加一个resizer就成了必然之选。

框架

这个放缩的框架很简单，把窗口大小填充给screen resolution，而渲染的分辨率则来自配置文件。如果两者不同，就加一个resizer拉伸一下。当然，如果两者连长宽比都不一样，就需要调整图像位置，在上下或者左右留边。

高质量放大

缩小比较容易，因为信息过剩。所以下文只讨论放大的问题。这里其实现在剩下的唯一问题就是，因为信息丢失，无论如何不能在放大后恢复出全部信息的。所以这里只能比较放大后的平滑程度，由此希望artifact尽量少。

质量比较

硬件本身能做的filter只有point和bilinear。如果需要更高质量的，可以用三阶的filter，比如bicubic。这里比较一下这几种filter对同样的输入会产生什么样的结果。原图来自于Windows的Playful Puppies主题的一张桌面墙纸，从1920×1200缩小到不同的分辨率，再upsample到1280×720，比较拉伸后的结果。bicubic的实现用的是wikipedia上的卷积公式，取A=-0.5。

896×504

首先试一下70%的大小。第一张是point filtering，已经有可察觉的锯齿（需要点开大图查看）：

理论上只要>50%，bilinear已经能达到非常高的效果，更高阶的也不会比bilinear好太多。

确实，除了高频的地方略微清晰之外，其他地方都看不出bicubic和bilinear的区别。

640×360

50%的大小下，point已经有明显的锯齿：

bilinear总的来说还行，但能看出比较模糊了。

bicubic仍然在高频的地方比较清晰。

384×216

30%的时候，point已经没法看了。

bilinear也有比较多的间断点。

bicubic的优势体现出来了。

51×29

顺便测试一个更极端的，4%的大小。point下已经完全没意义。

bilinear也充满了十字形的artifact。

bicubic由于保证了一阶连续，虽然也看不出形状，但仍保持平滑。

速度比较

这里point和bilinear都是用直接一次采样的实现。bicubic用的是separable的优化，把原本需要的16次采样减少到8次。这些filter都是在pixel shader里完成的，还没有用到compute shader。测试的GPU是NV 4200M。

大小	类型	时间（ms）
896×504	point	0.02
	bilinear	0.02
	bicubic	0.79
640×360	point	0.02
	bilinear	0.02
	bicubic	0.56
384×216	point	0.02
	bilinear	0.02
	bicubic	0.30

从结果可以看出，point和bilinear在现代GPU上已经完全没区别。bicubic因为采样多了8倍，并有一定的计算，性能低了很多，不过也不算慢。

总结

总的来说，如果放大比率小于两倍，那么bilinear就已经足够。大于两倍的时候，bicubic是个不错的选择。以后有时间我会再测试其他的高质量filter，比如lanczos, sinc等。这个放缩机制以后有可能进一步扩展到dynamic resolution。

从hg导入git的方法和坑

各家顶级桌面和移动GPU的性能功耗大比拼

bicubic

Comments

liujie

August 14th, 2013 at 10:59 PM

最近在实现RSM，遇到一个问题，我处理的是太阳光（方向光）的RSM，在摄像机移动时，光视锥体也需要跟着一起移动，这样VPL也在移动，一些地方会出现明暗变化的闪烁。目前发现原因是这样：与太阳光方向夹角很小的斜面在RSM本来渲染出来的面积就不大，RSM上看是一个细长的长方条，生成VPL时有时会跳过这个斜面。随着摄像机移动，VPL有时能落在这个条上，有时不能，这样导致本来应该被这个长条间接照亮的地面一会亮一会暗。VPL个数已经提高到64×64个了，RSM和ShadowMap尺寸一样，是1024×1024。求敏哥指点迷津

GONG Minmin

August 15th, 2013 at 1:03 PM

VPL一定会遇到那个问题

liujie

August 16th, 2013 at 8:07 AM

感谢敏哥回帖。
我们游戏是室外场景，视野比较远，即使不考虑我之前说的斜面这种情况，在人移动时，太阳光也跟着移动，VPL也在移动，因为VPL比较稀疏，估计是两三米一个VPL，落在同一个块区域VPL的位置会变化，会造成光的效果发生变化，这个有方法解决吗，我目前想设计一个移动VPL的方法，让每次VPL移动后正好落在之前在那的VPL同一个坐标上，就是说移动距离是VPL间隔的整数倍，目前还在试验。那个使用stencil mulres的代码示例里，为了减少VPL个数，把生成的RSM非常稀疏的采样到大概16×16的一个RT里，这样会使VPL间间隔更大，不知道klayge里是不是也是这么做？klayge里阴影图覆盖区域大概有多大，用了多少VPL，每个VPL间间隔大概多少米？

GONG Minmin

August 16th, 2013 at 12:29 PM

mrsil的原paper有提到这个事情，用改进的sampling来改善vpl的闪烁。我目前没实现这个改进，只限于室内场景，也用了16×16个光源。但有些光源有可能合并成一个更大的光源，进一步减少数量。覆盖范围也就30米左右。

liujie

August 17th, 2013 at 3:40 PM

我让摄像机移动时光视锥体每次移动VPL间隔的整数倍，效果看上去还可以，不会出现VPL抖动的情况了。
最近要实现天光的效果，解决太阳光照射不到、一次间接光照也反射不到的地方完全黑暗的情况，google了skylight这个关键字，好像没看到合适的论文和资料，这个方面有什么好资料吗？

GONG Minmin

August 18th, 2013 at 12:56 AM

但光源旋转的时候，这么做仍会抖动。skylight不是个技术，只是GI的应用。实时下得要bake，不然吃不消。

liujie

August 19th, 2013 at 9:49 PM

RSM可以实现一次间接光照，但是场景里直接光照和一次间接光照都没照到的地方就全黑了，虽然可以用常量ambient light统一照亮，但是不真实，这个有哪个技术效果更好，比如light probe

GONG Minmin

August 20th, 2013 at 2:06 PM

LPV可以解决，但代价很大。SVO可以彻底解决，但要求DX11。其他的更不实用了。

liujie

August 19th, 2013 at 10:38 PM

我们引擎里已经有SSAO了，不过感觉对室外场景效果不太明显，他主要对几角旮旯效果明显，目前还没找到什么好方法，我看KONAMI的fox引擎好像用的就是light probe，看起来效果不错。

GONG Minmin

August 20th, 2013 at 2:07 PM

light probe有条件的话还是该用用的。主流引擎都用这个方法做secondary效果。但空间占用确实很大，如果动态/静态分开，还要double空间消耗。

KlayGE游戏引擎