approx_count_distinct聚合函数

适用于:检查标记是的砖的SQL检查标记是的砖运行时

返回不同值的估计数字expr在组织内。

的实现使用密集的版本HyperLogLog + + (HLL + +)算法,一个国家的艺术基数估计算法。

结果在5%的默认值是准确的,它来源于最大相对标准偏差的价值,尽管这是可配置的relativeSD参数如下提到的。

语法

approx_count_distinct(expr(,relativeSD])(过滤器(在哪里气孔导度)]

这个函数也可以作为一个调用窗口函数使用条款。

参数

  • expr:可以是任何类型的等价定义。

  • relativeSD:定义允许的最大相对标准偏差。

  • 气孔导度:一个可选的布尔表达式过滤行用于聚合。

返回

长整型数字。

例子

>选择approx_count_distinct(col1)(1),(1),(2),(2),(3)选项卡(col1);3>选择approx_count_distinct(col1)过滤器(在哪里col2=10)(1,10),(1,10),(2,10),(2,10),(3,10),(1,12)作为选项卡(col1,col2);3