pyspark.pandas.extensions.register_index_accessor???

pyspark.pandas.extensions. register_index_accessor 高山市 名称:字符串 )QQ调用 [ [类型 [T级 万事通 万事通 ,类型 [T级 万事通 万事通 ???

注册自定义存取器并附索引

参数解析
名称 字符串

名注册后调用存取器

回归
可调用性

类装饰师

并见

register_dataframe_accessor

注册自定义访问器数据Frame对象

register_series_accessor

注册串行对象自定义存取器

注解

访问时,访问器将使用用户交互对象spandas对spark初始化代码签名必须是

def.init.高山市自定义,pandas_on_spark_obj:#构造者逻辑.

熊猫API中,如果数据传递到存取器有不正确的d类型,推荐提高属性错误一致性目的熊猫对Spark值错误更常使用注释值时,值数据类型对给定方法/函数出乎意料

归根结底,你可以构造它随心所欲, 但熊猫SPark可能做类似的事情

>>>ss系统.串行'a','b').dt系统.追踪回调(最近最后调用 数 数 数 数 数 数 数 数 数 数 数 数 数 数 数 数 数 数 数.值错误:无法调用日期定时方法类型StringType ()

实例

库代码中

发自pyspark.pandas.extensions导入register_index_accessor@register_index_accessor高山市"foo")自定义获取器:def.init.高山市自定义,pandas_on_spark_obj:自定义.obj=pandas_on_spark_obj自定义.项名=巴兹@propertydef高山市自定义:#返回项目值返回自定义.项名

后在ipython会话中

>>>#导入访问器>>># my_ext_lib导入自定义获取器>>>sdf=ss系统.数据Frame{{宽度:NP.林域高山市0,10).纬度:NP.林域高山市0,20码})>>>sdf.索引化.福市.巴兹