pyspark.sql.functions.max_by¶

pyspark.sql.functions。 max_by ( 上校:ColumnOrName,奥德:ColumnOrName )→pyspark.sql.column.Column¶

返回值与奥德的最大值。

参数

上校 列或str: 目标列将返回的值
奥德 列或str: 列是最大化

返回

列: 价值与奥德的最大值。

例子

           > > >df=火花。createDataFrame([…(“Java”,2012年,20000年),(“dotNET”,2012年,5000年),…(“dotNET”,2013年,48000年),(“Java”,2013年,30000年)),…模式=(“课程”,“年”,“收益”))> > >df。groupby(“课程”)。gg(max_by(“年”,“收益”))。显示()+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +| |当然max_by |(年收益)+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +Java | 2013 | || dotNET | 2013 |+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
          

以前的

pyspark.sql.functions.max

下一个

pyspark.sql.functions.mean