pyspark.sql.functions.transform

pyspark.sql.functions。 变换 ( 上校:ColumnOrName,f:联盟(可调用的((pyspark.sql.column.Column],pyspark.sql.column.Column],可调用的((pyspark.sql.column.Column,pyspark.sql.column.Column],pyspark.sql.column.Column]] )→pyspark.sql.column.Column

返回一个数组的元素应用转换后输入数组中的每个元素。

参数
上校 或str

的名字列或表达式

f 函数

一个函数,应用于输入数组的每个元素。可以采取下列形式之一:

  • 一元(x):列)- >专栏:

  • 二进制(x):列,我:列)- >列……,第二个参数是

    基于索引的元素。

和可以使用的方法、函数中定义pyspark.sql.functions和ScalaUserDefinedFunctions。PythonUserDefinedFunctions不支持(火星- 27052)。

返回

例子

> > >df=火花createDataFrame(((1,(1,2,3,4])),(“关键”,“价值观”))> > >df选择(变换(“价值观”,λx:x*2)别名(“翻倍”))显示()+ - - - - - - - - - - - - +| |翻了一番+ - - - - - - - - - - - - +(2、4、6、8)| |+ - - - - - - - - - - - - +
> > >def备用(x,):返回(%2= =0,x)否则(- - - - - -x)> > >df选择(变换(“价值观”,备用)别名(“交替”))显示()+ - - - - - - - - - - - - - - - - +|交替|+ - - - - - - - - - - - - - - - - +| | (1、2、3、4)+ - - - - - - - - - - - - - - - - +