approx_top_k
聚合函数
适用于:砖的SQL砖运行时10.2及以上
返回顶部k
最常发生在一个项值expr
以及它们的近似计算。
参数
expr
:一个表达式的字符串、布尔值、日期、时间戳、或数字类型。k
:一个可选的整型文字大于0。如果k
没有指定,默认吗5
。maxItemsTracked
:一个可选的整型文字大于或等于k
。如果maxItemsTracked
没有指定,默认吗10000年
。气孔导度
:一个可选的布尔表达式过滤行用于聚合。
返回
结果返回一个结构体类型的数组,其中每个结构体包含一个项
字段的值(与原来的输入类型)和一个数
类型的字段(长)的近似数出现。数组进行排序数
下行。
聚合函数返回顶部k
最频繁发生的项目值表达式中expr
以及它们的近似计算。每个数可能的错误2.0*numRows/maxItemsTracked
在哪里numRows
总行数。更高的值maxItemsTracked
提供更好的准确性在内存使用增加的成本。不到的表达式maxItemsTracked
不同的项目将产生精确的项数。结果包括零
值作为自己的项目结果。
例子
>选择approx_top_k (expr)值(0)(0)(1)(1),(2),(3),(4),(4)选项卡(expr);[{“项”:4,“数”:2},{“项”:1、“数”:2},{“项”:0,“数”:2},{“项”:3,“数”:1},{“项”:2,“数”:1}]>选择approx_top_k (expr 2)值' a ', ' b ', ' c ', ' c ', ' c ', ' c ', ' d ', ' d '选项卡(expr);[{“项”:“c”,“数”,4},{“项”:“d”,“数”:2}]>选择approx_top_k (expr, 100)从值(0)(1)(1),(2),(2),(2)选项卡(expr);[{“项”:2,“数”:3},{“项”:1、“数”:2},{“项”:0,“数”:1}]