pyspark.pandas.Index

pyspark.pandas。 指数

pandas-on-Spark索引对应于熊猫索引逻辑。这也许能引发列内部。

参数
数据 类数组(维)
dtype dtype,默认没有

如果dtype没有,我们找到最适合的dtype数据。如果提供一个实际的dtype,我们强迫dtype如果它是安全的。否则,它会抛出一个错误。

复制 bool

输入ndarray复制。

的名字 对象

名称存储在索引中。

tupleize_cols 布尔值(默认值:True)

当事实,试图创建一个MultiIndex如果可能的话。

另请参阅

MultiIndex

多层次、分级指数。

DatetimeIndex

datetime64指数数据。

Int64Index

的一种特殊情况指数与纯整数标签。

Float64Index

的一种特殊情况指数与纯粹的浮动标签。

例子

> > >psDataFrame({“一个”:(“一个”,“b”,“c”)},指数=(1,2,3])指数Int64Index ([1, 2, 3], dtype =“int64”)
> > >psDataFrame({“一个”:(1,2,3)},指数=列表(“abc”))指数指数([a, b, ' c '], dtype = '对象')
> > >ps指数([1,2,3])Int64Index ([1, 2, 3], dtype =“int64”)
> > >ps指数(列表(“abc”))指数([a, b, ' c '], dtype = '对象')

从一个系列:

> > >年代=ps系列([1,2,3),指数=(10,20.,30.])> > >ps指数(年代)Int64Index ([1, 2, 3], dtype =“int64”)

从一个指数:

> > >idx=ps指数([1,2,3])> > >ps指数(idx)Int64Index ([1, 2, 3], dtype =“int64”)

方法

所有([轴,skipna])

返回所有元素是否正确。

任何((轴))

返回任何元素是否为真。

附加(其他)

添加索引选项的集合在一起。

argmax()

返回一个最大参数索引器。

argmin()

返回一个最小参数索引器。

asof(标签)

返回标签从索引中,或者,如果不存在,那么前一个。

astype(dtype)

把指定dtype pandas-on-Spark对象dtype

复制((姓名、深))

这个对象的一个副本。

删除(loc)

与通过新索引位置(- s)删除。

区别(其他[,])

返回一个新的索引的元素索引不其他

下降(标签)

与通过新索引标签列表删除。

drop_duplicates([继续])

返回索引删除了重复的值。

droplevel(高度)

返回索引删除请求级别(s)。

dropna([如何])

返回索引或MultiIndex NA /南值

=(其他)

确定两个索引对象包含相同的元素。

因式分解([,na_sentinel])

编码对象为枚举类型或类别变量。

fillna(值)

NA / NaN值填充指定的值。

get_level_values(高度)

回报指数如果一个有效的水平。

holds_integer()

是否类型是整数类型。

相同的(其他)

类似于等于,但检查其他类似的属性也相等。

插入(loc项)

使新索引插入新项的位置。

十字路口(其他)

形成两个索引对象的交集。

is_boolean()

返回如果当前索引类型是一个布尔类型。

is_categorical()

返回如果当前索引类型分类类型。

is_floating()

返回如果当前索引类型是一个浮动的类型。

is_integer()

返回如果当前指数类型是整数类型。

is_interval()

返回如果当前指数类型是一个间隔类型。

is_numeric()

返回如果当前索引类型是数字类型。

is_object()

返回如果当前指数类型是对象类型。

is_type_compatible(一)

索引类型是否与所提供的类型兼容。

型号(值)

检查是否包含在系列或索引。

并网发电()

检测现有(non-missing)值。

isnull()

检测现有(non-missing)值。

()

返回第一个元素的底层数据作为一个python标量。

地图(映射器[na_action])

映射值使用输入对应(dict系列,或函数)。

马克斯()

返回索引的最大价值。

最小值()

返回索引的最小值。

notna()

检测现有(non-missing)值。

notnull()

检测现有(non-missing)值。

nunique([dropna,大约,rsd])

返回对象的独特的元素数量。

重命名(名称[,原地])

改变指数或MultiIndex名称。

重复(重复)

重复的元素索引/ MultiIndex。

set_names(名称、级别,原地)

设置索引或MultiIndex名字。

转变([时期,fill_value])

转变系列/索引所需数量的时期。

排序(* * kwargs * args)

使用sort_values代替。

sort_values([return_indexer,提升])

返回一个分类指数的副本,并可选地返回排序索引本身的指标。

symmetric_difference(其他,result_name])

计算两个索引对象的对称差分。

(指标)

返回给定的元素位置指数沿着一个轴。

to_frame([指数名称])

创建一个DataFrame包含索引的列。

to_list()

返回的列表值。

to_numpy([dtype,复制])

一个NumPy ndarray指数或MultiIndex代表值。

to_pandas()

返回一个熊猫指数。

to_series([名字])

创建一系列索引和索引键值等于有用地图返回一个基于索引的索引器。

tolist()

返回的列表值。

转置()

返回转置为索引,索引本身。

联盟(其他[,])

两个索引对象的结合形式。

独特的((水平))

返回索引中惟一值。

value_counts([正常化,排序,提升,…))

返回包含项系列独特的价值观。

视图()

这是定义为一个复制相同的身份

属性

T

返回转置为索引,索引本身。

asi8

整数表示的值。

dtype

返回dtype底层数据的对象。

返回true,如果当前对象是空的。

has_duplicates

如果指数有重复,返回True,否则错误的。

hasnans

如果有任何遗漏值返回True。

inferred_type

返回一个字符串的类型推断值。

is_all_dates

返回如果所有索引的数据类型是datetime。

is_monotonic

返回布尔值的对象是单调递增的。

is_monotonic_decreasing

返回布尔值的对象是否单调下降。

is_monotonic_increasing

返回布尔值的对象是单调递增的。

is_unique

返回如果指数具有独特的价值。

的名字

返回索引的名称。

的名字

返回索引的名称。

ndim

返回一个int数组维数代表的数量。

nlevels

的水平指数和MultiIndex。

形状

返回一个元组的底层数据的形状。

大小

返回一个int代表该对象的元素数量。

返回一个数组代表数据的索引。