pyspark.sql.functions.max_by

pyspark.sql.functions。 max_by ( 上校:ColumnOrName,奥德:ColumnOrName )→pyspark.sql.column.Column

返回值与奥德的最大值。

参数
上校 或str

目标列将返回的值

奥德 或str

列是最大化

返回

价值与奥德的最大值。

例子

> > >df=火花createDataFrame([(“Java”,2012年,20000年),(“dotNET”,2012年,5000年),(“dotNET”,2013年,48000年),(“Java”,2013年,30000年)),模式=(“课程”,“年”,“收益”))> > >dfgroupby(“课程”)gg(max_by(“年”,“收益”))显示()+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +| |当然max_by |(年收益)+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +Java | 2013 | || dotNET | 2013 |+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +