开始
加载和管理数据
处理数据
政府
引用和资源
2023年8月2日更新
给我们反馈
approx_count_distinct
适用于:砖的SQL砖运行时
返回不同值的估计数字expr在组织内。
expr
的实现使用密集的版本HyperLogLog + + (HLL + +)算法,一个国家的艺术基数估计算法。
结果在5%的默认值是准确的,它来源于最大相对标准偏差的价值,尽管这是可配置的relativeSD参数如下提到的。
relativeSD
approx_count_distinct(expr(,relativeSD])(过滤器(在哪里气孔导度)]
这个函数也可以作为一个调用窗口函数使用在条款。
在
expr:可以是任何类型的等价定义。
relativeSD:定义允许的最大相对标准偏差。
气孔导度:一个可选的布尔表达式过滤行用于聚合。
气孔导度
长整型数字。
>选择approx_count_distinct(col1)从值(1),(1),(2),(2),(3)选项卡(col1);3>选择approx_count_distinct(col1)过滤器(在哪里col2=10)从值(1,10),(1,10),(2,10),(2,10),(3,10),(1,12)作为选项卡(col1,col2);3
approx_percentile聚合函数
approx_top_k聚合函数