pyspark.pandas.Series.pipe¶
-
系列。
管
( 函数:可调用的[[…],任何),*arg游戏:任何,* *kwargs:任何 )→任何¶ -
应用函数(自我,* args, * * kwargs)。
- 参数
-
- 函数 函数
-
函数适用于DataFrame。
arg游戏
,kwargs
传递给函数
。另外一个(可调用的,data_keyword)
元组,data_keyword
是一个字符串显示关键字的可调用的
预计DataFrames。 - arg游戏 iterable,可选
-
位置参数传递给
函数
。 - kwargs 映射,可选
-
字典的关键字参数传入
函数
。
- 返回
-
-
对象
的返回类型
函数
。
-
对象
的返回类型
笔记
使用
.pipe
当链接在一起的功能期待系列,DataFrames或GroupBy对象。例如,给定> > >df=ps。DataFrame({“类别”:(“一个”,“一个”,“B”),…“col1”:(1,2,3),…“col2”:(4,5,6)},…列=(“类别”,“col1”,“col2”])> > >defkeep_category_a(df):…返回df(df(“类别”]= =“一个”]> > >defadd_one(df,列):…返回df。分配(col3=df(列]+1)> > >def乘(df,column1,column2):…返回df。分配(col4=df(column1]*df(column2])
而不是写
> > >乘(add_one(keep_category_a(df),列=“col1”),column1=“col2”,column2=“col3”)col1 col2 col3 col4类别0 1 2 4 81 2 5 3 15
你可以写
> > >(df。管(keep_category_a)…。管(add_one,列=“col1”)…。管(乘,column1=“col2”,column2=“col3”)…)col1 col2 col3 col4类别0 1 2 4 81 2 5 3 15
如果你有一个函数,将数据作为第二个参数(说),通过一个元组表示关键字预计数据。例如,假设
f
以数据为df
:> > >defmultiply_2(column1,df,column2):…返回df。分配(col4=df(column1]*df(column2])
然后你可以写
> > >(df。管(keep_category_a)…。管(add_one,列=“col1”)…。管((multiply_2,“df”),column1=“col2”,column2=“col3”)…)col1 col2 col3 col4类别0 1 2 4 81 2 5 3 15
您可以使用lambda逢
> > >ps。系列([1,2,3])。管(λx:(x+1)。重命名(“价值”))0 21 32 4名称:价值,dtype: int64