pyspark.pandas.CategoricalIndex.set_categories???
-
CategoricalIndex.
集分类
高山市 新分类:联盟[pandas.core.indexes.base.Index,链表万事通, 顺序排列:可选性[布卢尔万事通=无, 重命名:布卢尔=虚伪, 内置:布卢尔=虚伪 )QQ可选 [pyspark.pandas.indexes.category.CategoricalIndex 万事通 ??? -
设置类别到指定的新分类
新分类包括新类别(结果产生未使用类别)或删除旧类别(结果数值设置为NAN)。if重命名True类别简单重命名(项目小于或多于旧类将产生数值设置为 NaN或未使用类别)。
这种方法可同时执行多项增删和重排序动作,因此比通过比较专业方法执行单步速度快
方法不做检查(例如旧类别是否包括在重排序新类别中),这可能导致出人意料的变化,例如使用特殊字符串d类型时,它不认为S1字符串等于单字符串
- 参数解析
-
- 新分类 相似索引
-
类别按新顺序排列
- 顺序排列 布尔默认假
-
绝对值是否被视为定序绝对值不提供则不修改命令信息
- 重命名 布尔默认假
-
新分类是否应被视为旧类别重命名或重排序类别
- 内置 布尔默认假
-
是否重排序原位类别或返回本绝对数拷贝并重排序类别
- 回归
-
- 分类Index重排序类别或原位无
- 提升
-
- 值错误
-
新分类不验证类别
并见
-
rename_categories
-
重命名类别
-
reorder_categories
-
重排序类别
-
添加子类
-
添加新类别
-
remove_categories
-
删除指定的类别
-
remove_unused_categories
-
删除非使用类别
实例
>>>ix=ss系统.CategoricalIndex高山市链表高山市abccc)>>>ix分类Index ([a],b',b',c'类别=[a',b',c',命令=False,d类型='类
>>>ix.集分类〔'b',C)CisticalIndex([nan,b',b',c'类别=['b','c',命令=False,d类型='类
>>>ix.集分类〔一号,2,3万事通重命名=真实性)分类Index[1,2,2,3,3],类别=[1,2,3],序号=False,d类型='类
>>>ix.集分类〔一号,2,3万事通重命名=真实性,顺序排列=真实性)分类Index[1,2,2,3,3],类别=[1,2,3],顺序=True,d类型='类