pyspark.sql.DataFrame.approxQuantile???

数据Frame 近似量度 高山市 高山:联盟[字符串,链表[字符串万事通,图例[字符串万事通万事通, 概率:联盟[链表[浮点万事通,图例[浮点万事通万事通, 相对错误:浮点 )联 [链表 [浮点万事通 ,链表 [链表 [浮点万事通万事通万事通 ???

计算数值列约量化数据Frame.

算法结果有下列确定性约束值:数据Frame带N元素并请求概率量化公元前顶级报错误差后算法返回样本X级从数据Frame并实现精度级X级接近p*N更精确地说

楼层(p-错误)*N)

方法执行Greenwald-Khanna算法变换算法首创https://doi.org/10.1145/375663.375670空间高效在线计算量子摘要bject-Greenwald和Khanna

注意无效值在计算前在数值列中忽略列中只含无效值,空表返回

参数解析

回归

前一

pyspark.sql.DataFrame.alias

下一个

pyspark.sql.DataFrame.cache