pyspark.SparkContext.union

SparkContext。 联盟 ( 抽样:列表(pyspark.rdd.RDD(T]] )→pyspark.rdd.RDD(T]

建立联盟的抽样的列表。

这支持工会()的抽样不同的序列化格式,尽管这迫使他们reserialized使用默认的序列化器:

例子

> > >路径=操作系统路径加入(tempdir,“union-text.txt”)> > >开放(路径,“w”)作为测试文件:_=测试文件(“你好”)> > >文本文件=sc文本文件(路径)> > >文本文件收集()['你好']> > >并行=sc并行化([“世界!”])> > >排序(sc联盟([文本文件,并行])收集())(“你好”,“世界!”)