pyspark.streaming.DStream.window

DStream。 窗口 ( windowDuration:int,slideDuration:可选(int]=没有一个 )→pyspark.streaming.dstream.DStream(T]

返回一个新的DStream每个抽样包含的所有元素在时间滑动窗口中看到这个DStream。

参数
windowDuration int

窗口的宽度;必须是一个多个DStream的批处理区间

slideDuration int,可选

滑动窗口的时间间隔(即。,the interval after which the new DStream will generate RDDs); must be a multiple of this DStream’s batching interval