hll_sketch_agg聚合函数

适用于:检查标记是的砖的SQL检查标记是的砖运行时13.1及以后

这个函数使用HyperLogLog算法计算概率近似给定列中独特的数量值,并输出结果作为二进制表示称为素描缓冲区。本二进制表示适用于持久性。

查询可以使用生成的缓冲区来计算近似独特的计数的hll_sketch_estimate函数。

hll_unionhll_union_agg函数也可以结合草图由消费和合并这些缓冲区作为输入。

实现使用Apache Datasketches图书馆。请参阅高级语言为更多的信息。

语法

hll_sketch_agg(expr(,lgConfigK])

这个函数也可以作为一个调用窗口函数使用条款。

参数

  • expr:一个表达式的类型INT,长整型数字,字符串,或二进制针对其独特的计算。

  • lgConfigK:一个可选的INT持续4 - 21包容性与默认的12。log-base-2 K, K是素描的桶或槽。

任何expr将被忽略。

返回

一个非二进制缓冲区包含HyperLogLog素描计算由于消费和聚合的聚合组中所有输入值。

例子

>选择hll_sketch_estimate(hll_sketch_agg(上校,12))(1),(1),(2),(2),(3)选项卡(上校);3>选择hll_sketch_estimate(hll_sketch_agg(上校))(1),(1),(2),(2),(3)选项卡(上校);3