pyspark.RDD.pipe

抽样。 ( 命令:str,env:可选(Dict(str,str]]=没有一个,checkCode:bool= )→pyspark.rdd.RDD(str]

返回一个抽样由管道元素一个分叉的外部过程。

参数
命令 str

命令来运行。

env 东西,可选

环境变量设置。

checkCode bool,可选

是否检查shell命令的返回值。

例子

> > >sc并行化([' 1 ',' 2 ',,“3”])(“猫”)收集()(' 1 ',' 2 ',”,“3”)