SummaryBuilder

pyspark.ml.stat。 SummaryBuilder ( jSummaryBuilder:JavaObject )

生成器对象提供关于一个给定的列的汇总统计。

用户不能直接创建这样的建筑商,而是使用的方法之一pyspark.ml.stat.Summarizer

方法

总结(featuresCol [weightCol])

返回一个聚合对象包含列的汇总与请求的指标。

方法的文档

总结 ( featuresCol:pyspark.sql.column.Column,weightCol:可选(pyspark.sql.column.Column]=没有一个 )→pyspark.sql.column.Column

返回一个聚合对象包含列的汇总与请求的指标。

参数
featuresCol str

一个列包含特征向量对象。

weightCol str,可选

一个列包含重量值。默认的重量是1.0。

返回
pyspark.sql.Column

一个聚合列包含统计数据。这个结构决定的具体内容在构建器的创建。