pyspark.sql.functions.zip_with¶

pyspark.sql.functions。 zip_with ( 左:ColumnOrName,正确的:ColumnOrName,f:可调用的((pyspark.sql.column.Column,pyspark.sql.column.Column],pyspark.sql.column.Column] )→pyspark.sql.column.Column¶

合并两个数组,element-wise,到一个数组中使用一个函数。如果一个数组是短,null是附加在比赛时间越长数组的长度,在应用功能。

参数

左 列或str: 第一个列或表达式
正确的 列或str: 名称,第二列或表达式
f 函数: 一个二元函数(x1:列,x2:列)- >列……可以使用的方法列、函数中定义pyspark.sql.functions和ScalaUserDefinedFunctions。PythonUserDefinedFunctions不支持(火星- 27052)。

返回

列

例子

           > > >df=火花。createDataFrame(((1,(1,3,5,8),(0,2,4,6])),(“id”,“x”,“y”))> > >df。选择(zip_with(“x”,“y”,λx,y:x* *y)。别名(“权力”))。显示(截断=假)+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +权力| |+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +| | (1.0,9.0,625.0,262144.0)+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +
          

           > > >df=火花。createDataFrame(((1,(“foo”,“酒吧”),(1,2,3])),(“id”,“x”,“y”))> > >df。选择(zip_with(“x”,“y”,λx,y:concat_ws(“_”,x,y))。别名(“xs_ys”))。显示()+ - - - - - - - - - - - - - - - - - - +| xs_ys |+ - - - - - - - - - - - - - - - - - - +| | foo_1 bar_2 3+ - - - - - - - - - - - - - - - - - - +
          

以前的

pyspark.sql.functions.aggregate

下一个

pyspark.sql.functions.transform_keys