pyspark.streaming.DStream.countByWindow

DStream。 countByWindow ( windowDuration:int,slideDuration:int )→pyspark.streaming.dstream.DStream(int]

返回一个新的DStream每个抽样生成单个元素通过计算元素的数量在一个窗口DStream。windowDuration和slideDuration中定义的窗口()操作。

这相当于窗口(windowDuration slideDuration) .count(),但如果窗户很大将更有效。