pyspark.sql.SparkSession.range

SparkSession。 范围 ( 开始:int,结束:可选(int]=没有一个,一步:int=1,numPartitions:可选(int]=没有一个 )→pyspark.sql.dataframe.DataFrame

创建一个DataFrame与单pyspark.sql.types.LongType列命名id,包含元素的范围从开始结束(独家)值一步

参数
开始 int

开始值

结束 int,可选

最终值(独家)

一步 int,可选

增量步(默认值:1)

numPartitions int,可选

DataFrame分区的数量

返回
DataFrame

例子

> > >火花范围(1,7,2)收集()(行(id = 1),行(id = 3),行(id = 5)]

如果只指定一个参数,它将被用作最后的价值。

> > >火花范围(3)收集()(行(id = 0)、行(id = 1),行(id = 2))