pyspark.SparkContext.union¶

SparkContext。 联盟 ( 抽样:列表(pyspark.rdd.RDD(T]] )→pyspark.rdd.RDD(T] ¶

建立联盟的抽样的列表。

这支持工会()的抽样不同的序列化格式,尽管这迫使他们reserialized使用默认的序列化器:

例子

           > > >路径=操作系统。路径。加入(tempdir,“union-text.txt”)> > >与开放(路径,“w”)作为测试文件:…_=测试文件。写(“你好”)> > >文本文件=sc。文本文件(路径)> > >文本文件。收集()['你好']> > >并行=sc。并行化([“世界!”])> > >排序(sc。联盟([文本文件,并行])。收集())(“你好”,“世界!”)
          

以前的

pyspark.SparkContext.uiWebUrl

下一个

pyspark.SparkContext.version