pyspark.pandas.extensions.register_index_accessor???
-
pyspark.pandas.extensions.
register_index_accessor
高山市 名称:字符串 )QQ调用 [ [类型 [T级 万事通 万事通 ,类型 [T级 万事通 万事通 ??? -
注册自定义存取器并附索引
- 参数解析
-
- 名称 字符串
-
名注册后调用存取器
- 回归
-
- 可调用性
-
类装饰师
并见
-
register_dataframe_accessor
-
注册自定义访问器数据Frame对象
-
register_series_accessor
-
注册串行对象自定义存取器
注解
访问时,访问器将使用用户交互对象spandas对spark初始化代码签名必须是
def.init.高山市自定义,pandas_on_spark_obj:#构造者逻辑.
熊猫API中,如果数据传递到存取器有不正确的d类型,推荐提高
属性错误
一致性目的熊猫对Spark值错误
更常使用注释值时,值数据类型对给定方法/函数出乎意料归根结底,你可以构造它随心所欲, 但熊猫SPark可能做类似的事情
>>>ss系统.串行〔'a','b').dt系统.追踪回调(最近最后调用 数 数 数 数 数 数 数 数 数 数 数 数 数 数 数 数 数 数 数.值错误:无法调用日期定时方法类型StringType ()
实例
库代码中
发自pyspark.pandas.extensions导入register_index_accessor@register_index_accessor高山市"foo")类自定义获取器:def.init.高山市自定义,pandas_on_spark_obj:自定义.obj=pandas_on_spark_obj自定义.项名=巴兹@propertydef栏高山市自定义:#返回项目值返回自定义.项名
后在ipython会话中
>>>#导入访问器>>># my_ext_lib导入自定义获取器>>>sdf=ss系统.数据Frame{{宽度:NP.林域高山市0,10).纬度:NP.林域高山市0,20码})>>>sdf.索引化.福市.栏巴兹