pyspark.SparkContext.union¶
-
SparkContext。
联盟
( 抽样:列表(pyspark.rdd.RDD(T]] )→pyspark.rdd.RDD(T] ¶ -
建立联盟的抽样的列表。
这支持工会()的抽样不同的序列化格式,尽管这迫使他们reserialized使用默认的序列化器:
例子
> > >路径=操作系统。路径。加入(tempdir,“union-text.txt”)> > >与开放(路径,“w”)作为测试文件:…_=测试文件。写(“你好”)> > >文本文件=sc。文本文件(路径)> > >文本文件。收集()['你好']> > >并行=sc。并行化([“世界!”])> > >排序(sc。联盟([文本文件,并行])。收集())(“你好”,“世界!”)