使用tablefunc进行多列透视
问题:
如何利用tablefunc对多个变量进行数据透视,而不仅仅是使用行名?
背景:
包含数十亿行的数据集需要透视成宽格式,以便有效比较对众多实体进行的多次测量。这些测量结果差异很大,需要频繁地将数据透视成宽格式。
问题:
标准的tablefunc方法假设属性列(又称“额外”列)对于每个行名都是一致的。如果在一个行名内属性列存在多个值,则只报告第一个值,导致透视输出中的数据不完整。
解决方案:
为了克服这个限制,需要重新排序查询列,将属性列放在行名列之前。这确保了属性值从每个行名分区的首行填充,从而捕获该行名的所有不同属性值。
代码:
<code class="language-sql">SELECT * FROM crosstab( 'SELECT entity, timeof, status, ct FROM t4 ORDER BY entity' , 'VALUES (1), (0)' ) AS ct ( "Attribute" character , "Section" timestamp , "status_1" int , "status_0" int );</code>
总结:
通过反转前两列的顺序(属性列在行名列之前),tablefunc可以有效地对多个变量进行数据透视,提供完整的透视输出。这种方法适用于数据集包含每个行名不同数量的属性值的情况。
以上是Tablefunc 如何处理多变量旋转以避免数据丢失?的详细内容。更多信息请关注PHP中文网其他相关文章!