pyspark.pandas.Series.cat.set_categories???

猫咪 集分类 高山市 新分类:联盟[pandas.core.indexes.base.Index,链表万事通, 顺序排列:可选性[布卢尔万事通=无, 重命名:布卢尔=虚伪, 内置:布卢尔=虚伪 )QQ可选 [s串行万事通 ???

设置类别到指定的新分类

新分类包括新类别(结果产生未使用类别)或删除旧类别(结果数值设置为NAN)。if重命名True类别简单重命名(项目小于或多于旧类将产生数值设置为 NaN或未使用类别)。

这种方法可同时执行多项增删和重排序动作,因此比通过比较专业方法执行单步速度快

方法不做检查(例如旧类别是否包括在重排序新类别中),这可能导致出人意料的变化,例如使用特殊字符串d类型时,它不认为S1字符串等于单字符串

参数解析

回归

提升

并见

实例

           >>>s级=ss系统.串行高山市链表高山市abccc)d类型=类别类)>>>s级0a1b2b3c4c5cd类型:类别类别3,对象:
          

           >>>s级.猫.集分类〔'b',C)0N1b2b3c4c5cd类型:类别类别2,对象:
          

           >>>s级.猫.集分类〔一号,2,3万事通重命名=真实性)01一二二二3 34 35 3d类型:类别类别(3, int64):[1,2,3
          

           >>>s级.猫.集分类〔一号,2,3万事通重命名=真实性,顺序排列=真实性)01一二二二3 34 35 3d类型:类别类别(3, int64):[1 < 2 < 3]
          

前一

pyspark.pandas.Series.cat.remove_unused_categories

下一个

pyspark.pandas.Series.cat.as_ordered