集群BY子句

适用于:检查标记是的砖的SQL检查标记是的砖运行时

重新分配数据基于输入表达式,然后每个分区内的数据。这是执行一个语义上等价分发的紧随其后的是一个排序。这一条款只有确保每个分区内合成行排序,并不能保证全序输出。

语法

集群通过表达式(,]

参数

  • 表达式

    指定一个或多个值的组合,运营商和SQL函数,结果在一个值。

例子

>创建临时视图(的名字,年龄)作为(“禅回族”,25),(“阿尼尔B”,18),(照年代”,16),(“迈克”,25),(“约翰一”,18),(“杰克N”,16);——调整分区的数量减少到2来说明的集群”的行为。——很容易看到聚类和排序行为更少数量的分区。>火花sql洗牌分区=2;——选择行没有订购。请注意,没有任何指示,结果——查询的不确定性。这里包括行为的差异——查询当不使用的集群的vs的时候使用。下面的查询生成的行——年龄列排序。>选择年龄,的名字;16年代25回族16杰克N25迈克一个18约翰一个18阿尼尔B——生产行集群的年龄。同年龄的人聚集在一起。在下面的查询,与18岁和25人在第一个分区和——16岁的人都在第二个分区。行排序——年龄在每个分区上。>选择年龄,的名字集群通过年龄;18约翰一个18阿尼尔B25回族25迈克一个16年代16杰克N