SparseVector

pyspark.mllib.linalg。 SparseVector ( 大小:int,*arg游戏:联盟(字节,元组(int,浮动],Iterable(浮动],Iterable(元组(int,浮动]],Dict(int,浮动]] )

一个简单的稀疏向量类MLlib传递数据。用户可能会选择通过SciPy {SciPy。稀疏}数据类型。

方法

asML()

这个向量转换为新的mllib-local表示。

(其他)

点积SparseVector或1 -或二维Numpy数组。

规范(p)

计算SparseVector的规范。

numNonzeros()

非零元素的数量。

解析(年代)

解析字符串表示回SparseVector。

squared_distance(其他)

的平方距离SparseVector或维NumPy数组。

toArray()

返回一个副本SparseVector作为维NumPy数组。

方法的文档

asML ( )pyspark.ml.linalg.SparseVector

这个向量转换为新的mllib-local表示。这并不复制数据;它复制引用。

返回
pyspark.ml.linalg.SparseVector
( 其他:Iterable(浮动] )→numpy.float64

点积SparseVector或1 -或二维Numpy数组。

例子

> > >一个=SparseVector(4,(1,3),(3.0,4.0])> > >一个(一个)25.0> > >一个(数组数组(' d ',(1。,2。,3所示。,4所示。)))22.0> > >b=SparseVector(4,(2),(1.0])> > >一个(b)0.0> > >一个(np数组([[1,1),(2,2),(3,3),(4,4]]))数组([22。,22。)> > >一个([1。,2。,3所示。])回溯(最近的电话):AssertionError:尺寸不匹配> > >一个(np数组([1。,2。)))回溯(最近的电话):AssertionError:尺寸不匹配> > >一个(DenseVector([1。,2。)))回溯(最近的电话):AssertionError:尺寸不匹配> > >一个(np0((3,2)))回溯(最近的电话):AssertionError:尺寸不匹配
规范 ( p:NormType )→numpy.float64

计算SparseVector的规范。

例子

> > >一个=SparseVector(4,(0,1),(3所示。,- - - - - -4所示。])> > >一个规范(1)7.0> > >一个规范(2)5.0
numNonzeros ( )→int

非零元素的数量。这个扫描所有活跃的非零值和计数。

静态 解析 ( 年代:str )pyspark.mllib.linalg.SparseVector

解析字符串表示回SparseVector。

例子

> > >SparseVector解析(”(4 [0,1][4.0,5.0])”)SparseVector ({0: 4.0, 1: 5.0})
squared_distance ( 其他:Iterable(浮动] )→numpy.float64

的平方距离SparseVector或维NumPy数组。

例子

> > >一个=SparseVector(4,(1,3),(3.0,4.0])> > >一个squared_distance(一个)0.0> > >一个squared_distance(数组数组(' d ',(1。,2。,3所示。,4所示。)))11.0> > >一个squared_distance(np数组([1。,2。,3所示。,4所示。)))11.0> > >b=SparseVector(4,(2),(1.0])> > >一个squared_distance(b)26.0> > >bsquared_distance(一个)26.0> > >bsquared_distance([1。,2。])回溯(最近的电话):AssertionError:尺寸不匹配> > >bsquared_distance(SparseVector(3,(1),(1.0,)))回溯(最近的电话):AssertionError:尺寸不匹配
toArray ( )→numpy.ndarray

返回一个副本SparseVector作为维NumPy数组。