pyspark.Broadcast

pyspark。 广播 ( sc:可选(SparkContext]=没有一个,价值:可选(T]=没有一个,pickle_registry:可选(BroadcastPickleRegistry]=没有一个,路径:可选(str]=没有一个,sock_file:可选(BinaryIO]=没有一个 )

一个广播变量创建SparkContext.broadcast ()。访问它的价值通过价值

例子

> > >pyspark.context进口SparkContext> > >sc=SparkContext(“本地”,“测试”)> > >b=sc广播([1,2,3,4,5])> > >b价值(1、2、3、4、5)> > >sc并行化([0,0])flatMap(λx:b价值)收集()(1、2、3、4、5、1,2,3,4,5]> > >bunpersist()
> > >large_broadcast=sc广播(范围(10000年))

方法

摧毁((阻塞))

消灭所有相关数据和元数据广播变量。

转储(f值)

init_with_process_isolation(sc、价值…)

初始化变量通过广播信任文件路径。

负载(文件)

load_from_path(路径)

unpersist((阻塞))

删除缓存的副本这播出执行人。

属性

价值

返回播放的值