pyspark.pandas.Index.factorize???

索引化 因子分解 高山市 排序方式:布卢尔=真实性, Na_sentiel:可选性[整数万事通=- 1 )图例 [索引Ops类 ,pandas.core.indexes.base.Index 万事通 ???

编码对象为枚举类型或绝对变量

方法有助于获取数组数字表示法,当所有问题都指向异值时

参数解析
排序方式 布尔默认 True
Na_sentiel int或None默认-1

值标记“未找到”。if non,nn不从唯一值中下降

回归
代码编码 数列或索引

A串或索引索引独特性.uniques.take(codes)将拥有同值传值.

独特性 pd.Index

唯一有效值

注解

即使是缺失值传值,独特性威尔不对内装项 。

实例

>>>serser服务=ss系统.串行'b',,'a',C,'b')>>>代码编码,独特性=serser服务.因子分解(b)>>>代码编码01一至一二零324 1d类型: int32>>>独特性索引([a],b,c],d类型=ject
>>>代码编码,独特性=serser服务.因子分解高山市Na_sentiel=)>>>代码编码01一三二零324 1d类型: int32>>>独特性索引([a],b',c',none],d类型=object
>>>代码编码,独特性=serser服务.因子分解高山市Na_sentiel=-2)>>>代码编码01一二二零324 1d类型: int32>>>独特性索引([a],b,c],d类型=ject

索引使用量 :

>>>sidx=ss系统.索引类'b',,'a',C,'b')>>>代码编码,独特性=sidx.因子分解(b)>>>代码编码int64Index[1,0,2,1],d类型='int64'>>>独特性索引([a],b,c],d类型=ject