把float编码到RGBA8

Aug 27

转载请注明出处为KlayGE游戏引擎，本文的永久链接为http://www.klayge.org/?p=2635

前一阵子在把KlayGE的OpenGLES插件升级到OpenGL ES 3的过程中，原先还满怀希望地觉得GLES3总该全面支持浮点纹理的读写了，结果发现GLES3的标准支持float16和float32的读取，但不支持渲染到float16/float32的纹理上。只有支持GL_EXT_color_buffer_float或GL_EXT_color_buffer_half_float扩展的硬件，比如Tegra 4和Adreno 3xx才能很好地支持。所以，在其他设备上如果要渲染到浮点纹理，就得另想办法了。

编码和解码

单通道的float是32-bit，RGBA8也是，所以按说把float编码到RGBA8的纹理中应该没啥问题。很可惜的是，不支持浮点纹理的硬件往往也不支持整数指令和位运算操作。所以在这里需要有些限制。在网上搜了一下，最靠谱的应该是大牛Aras Pranckevičius（aras-p）多年前的帖子。他的做法可以把[0, 1)范围内的浮点数，仅仅用shader model 2的指令，就编码到RGBA8。其实[0, 1)基本就够用了，其他的只要除个常数，读取后乘回去就可以了。编码和解码的函数很简单：

float4 EncodeFloatRGBA(float v)
{
   float4 enc = float4(1.0f, 255.0f, 65025.0f, 16581375.0f) * v;
   enc = frac(enc);
   enc -= enc.yzww * float4(1 / 255.0f, 1 / 255.0f, 1 / 255.0f, 0);
   return enc;
}

float DecodeFloatRGBA(float4 rgba)
{
   return dot(rgba, float4(1, 1 / 255.0f, 1 / 65025.0f, 1 / 16581375.0f));
}

这里的65025和16581375其实就是255的平方和立方。（aras-p的原文有一处笔误，把16581375写成了160581375。）

用途

这个东西能用在什么地方呢？流水线中目前有三处可能可以用到的：

HDR post process

在HDR post process里面，通过统计图像来产生自适应亮度调整的时候，只用到了单通道的float16和float32纹理，所以这里可以用这个方法进行编码。

Depth

在Pre-depth的时候，也可以把32-bit的depth编码后存到RGBA8。

ESM

Exponential shadow map只需要用到一个通道，也能顺利使用这个技巧。

这些应用我以后都会有专门的帖子展开讨论。

再次放出高质量可自由使用的3D模型

不同平台上的HDR Post Process

float, RGBA8

Comments

不同平台上的HDR Post Process - KlayGE游戏引擎

August 29th, 2013 at 11:32 PM

[…] 代表平台是D3D11 level 9.3，OpenGL 2.0，早期的shader model 2硬件，以及Adreno 3xx和Tegra 4这样的高端OpenGL ES 2/3的移动GPU。这样的平台基本不支持R32F，而且最奇葩之处在于支持四通道的ABGR16F，却不支持单通道和两通道的R16F。如果这时候把所有本来是R16F的都扩充到ABGR16F，显然带宽、存储空间和速度都会受到很大影响。所以在这样的平台上，更好的方法是用前几天提到过的，把float编码到四个8bit。当然，这样的平台也往往不支持G10B11R11F，所以输入改为ABGR16F的格式。 […]
切换到ESM - KlayGE游戏引擎

October 7th, 2013 at 2:34 PM

[…] 2006年以来， KlayGE一直都是用Variance Shadow Map（VSM）来表达阴影。VSM只比标准shadow map（SSM）增加了几行代码，但却能通过插值，极大减少边缘的锯齿，甚至模拟软阴影的效果。VSM的缺点是，需要抓用两个32F的通道。这么一来，带宽消耗大得多了，并且没办法通过编码到RGBA8的技巧在不支持浮点纹理的设备上使用。另外，VSM的light leak也是很讨厌的毛病，需要仔细调参数才能减轻。 […]

KlayGE游戏引擎