pyspark.sql.functions.zip_with

pyspark.sql.functions。 zip_with ( :ColumnOrName,正确的:ColumnOrName,f:可调用的((pyspark.sql.column.Column,pyspark.sql.column.Column],pyspark.sql.column.Column] )→pyspark.sql.column.Column

合并两个数组,element-wise,到一个数组中使用一个函数。如果一个数组是短,null是附加在比赛时间越长数组的长度,在应用功能。

参数
或str

第一个列或表达式

正确的 或str

名称,第二列或表达式

f 函数

一个二元函数(x1:列,x2:列)- >列……可以使用的方法、函数中定义pyspark.sql.functions和ScalaUserDefinedFunctions。PythonUserDefinedFunctions不支持(火星- 27052)。

返回

例子

> > >df=火花createDataFrame(((1,(1,3,5,8),(0,2,4,6])),(“id”,“x”,“y”))> > >df选择(zip_with(“x”,“y”,λx,y:x* *y)别名(“权力”))显示(截断=)+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +权力| |+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +| | (1.0,9.0,625.0,262144.0)+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
> > >df=火花createDataFrame(((1,(“foo”,“酒吧”),(1,2,3])),(“id”,“x”,“y”))> > >df选择(zip_with(“x”,“y”,λx,y:concat_ws(“_”,x,y))别名(“xs_ys”))显示()+ - - - - - - - - - - - - - - - - - - +| xs_ys |+ - - - - - - - - - - - - - - - - - - +| | foo_1 bar_2 3+ - - - - - - - - - - - - - - - - - - +