pyspark.SparkContext.binaryRecords

SparkContext。 binaryRecords ( 路径:str,recordLength:int )→pyspark.rdd.RDD(字节]

加载数据从一个平坦的二进制文件,假设每个记录是一组数字与指定的数值格式(见ByteBuffer),和每个记录的字节数是恒定的。

参数
路径 str

输入数据文件目录

recordLength int

将记录的长度