Word2VecModel

pyspark.mllib.feature。 Word2VecModel ( java_model:py4j.java_gateway.JavaObject )

类Word2Vec模型

方法

调用(名字,*一个)

调用的方法java_model

findSynonyms(num词)

找到一个单词的同义词

getVectors()

返回一个地图的单词向量表示。

负载(sc路径)

从给定的路径加载模型。

保存(sc路径)

这个模型保存到给定的路径。

变换(词)

转换一个词向量表示

方法的文档

调用 ( 的名字:str,*一个:任何 )→任何

调用的方法java_model

findSynonyms ( :联盟(str,VectorLike],全国矿工工会:int )→Iterable(元组(str,浮动] ]

找到一个单词的同义词

参数
str或pyspark.mllib.linalg.Vector

一个词或一个向量表示的词

全国矿工工会 int

数量的同义词

返回
collections.abc.Iterable

数组(词,cosineSimilarity)

笔记

当地只使用

getVectors ( )→py4j.java_collections.JavaMap

返回一个地图的单词向量表示。

classmethod 负载 ( sc:pyspark.context.SparkContext,路径:str )pyspark.mllib.feature.Word2VecModel

从给定的路径加载模型。

保存 ( sc:pyspark.context.SparkContext,路径:str )→没有

这个模型保存到给定的路径。

变换 ( :str )pyspark.mllib.linalg.Vector

转换一个词向量表示

参数
str

一个词

返回
pyspark.mllib.linalg.Vector

词(s)的向量表示

笔记

当地只使用