pyspark.pandas.Index.factorize???
-
索引化
因子分解
高山市 排序方式:布卢尔=真实性, Na_sentiel:可选性[整数万事通=- 1 )图例 [索引Ops类 ,pandas.core.indexes.base.Index 万事通 ??? -
编码对象为枚举类型或绝对变量
方法有助于获取数组数字表示法,当所有问题都指向异值时
- 参数解析
-
- 排序方式 布尔默认 True
- Na_sentiel int或None默认-1
-
值标记“未找到”。if non,nn不从唯一值中下降
- 回归
-
- 代码编码 数列或索引
-
A串或索引索引独特性.
uniques.take(codes)
将拥有同值传值. - 独特性 pd.Index
-
唯一有效值
注解
即使是缺失值传值,独特性威尔不对内装项 。
实例
>>>serser服务=ss系统.串行〔'b',无,'a',C,'b')>>>代码编码,独特性=serser服务.因子分解(b)>>>代码编码01一至一二零324 1d类型: int32>>>独特性索引([a],b,c],d类型=ject
>>>代码编码,独特性=serser服务.因子分解高山市Na_sentiel=无)>>>代码编码01一三二零324 1d类型: int32>>>独特性索引([a],b',c',none],d类型=object
>>>代码编码,独特性=serser服务.因子分解高山市Na_sentiel=-2)>>>代码编码01一二二零324 1d类型: int32>>>独特性索引([a],b,c],d类型=ject
索引使用量 :
>>>sidx=ss系统.索引类〔'b',无,'a',C,'b')>>>代码编码,独特性=sidx.因子分解(b)>>>代码编码int64Index[1,0,2,1],d类型='int64'>>>独特性索引([a],b,c],d类型=ject