approx_top_k聚合函数

适用于:检查标记是的砖的SQL检查标记是的砖运行时10.2及以上

返回顶部k最常发生在一个项值expr以及它们的近似计算。

语法

approx_top_k(expr(,k(,maxItemsTracked]])(过滤器(在哪里气孔导度)]

这个函数也可以作为一个调用窗口函数使用条款。

参数

  • expr:一个表达式的字符串、布尔值、日期、时间戳、或数字类型。

  • k:一个可选的整型文字大于0。如果k没有指定,默认吗5

  • maxItemsTracked:一个可选的整型文字大于或等于k。如果maxItemsTracked没有指定,默认吗10000年

  • 气孔导度:一个可选的布尔表达式过滤行用于聚合。

返回

结果返回一个结构体类型的数组,其中每个结构体包含一个字段的值(与原来的输入类型)和一个类型的字段(长)的近似数出现。数组进行排序下行。

聚合函数返回顶部k最频繁发生的项目值表达式中expr以及它们的近似计算。每个数可能的错误2.0*numRows/maxItemsTracked在哪里numRows总行数。更高的值maxItemsTracked提供更好的准确性在内存使用增加的成本。不到的表达式maxItemsTracked不同的项目将产生精确的项数。结果包括值作为自己的项目结果。

例子

>选择approx_top_k (expr)值(0)(0)(1)(1),(2),(3),(4),(4)选项卡(expr);[{“项”:4,“数”:2},{“项”:1、“数”:2},{“项”:0,“数”:2},{“项”:3,“数”:1},{“项”:2,“数”:1}]>选择approx_top_k (expr 2)值' a ', ' b ', ' c ', ' c ', ' c ', ' c ', ' d ', ' d '选项卡(expr);[{“项”:“c”,“数”,4},{“项”:“d”,“数”:2}]>选择approx_top_k (expr, 100)从值(0)(1)(1),(2),(2),(2)选项卡(expr);[{“项”:2,“数”:3},{“项”:1、“数”:2},{“项”:0,“数”:1}]