KernelDensity

pyspark.mllib.stat。 KernelDensity

估计概率密度在需要点给定样本人口的抽样。

例子

> > >kd=KernelDensity()> > >样本=sc并行化([0.0,1.0])> > >kdsetSample(样本)> > >kd估计([0.0,1.0])阵列([0.12938758,0.12938758])

方法

估计(分)

估计概率密度点

setBandwidth(带宽)

设置每个样本的带宽。

setSample(样本)

设置采样点的数量。

方法的文档

估计 ( :Iterable(浮动] )→numpy.ndarray

估计概率密度点

setBandwidth ( 带宽:浮动 )→没有

设置每个样本的带宽。默认为1.0

setSample ( 样本:pyspark.rdd.RDD(浮动] )→没有

设置采样点的数量。应该是一个抽样