索引对象

指数

指数

pandas-on-Spark索引对应于熊猫索引逻辑。

属性

Index.is_monotonic

返回布尔值的对象是单调递增的。

Index.is_monotonic_increasing

返回布尔值的对象是单调递增的。

Index.is_monotonic_decreasing

返回布尔值的对象是否单调下降。

Index.is_unique

返回如果指数具有独特的价值。

Index.has_duplicates

如果指数有重复,返回True,否则错误的。

Index.hasnans

如果有任何遗漏值返回True。

Index.dtype

返回dtype底层数据的对象。

Index.inferred_type

返回一个字符串的类型推断值。

Index.is_all_dates

返回如果所有索引的数据类型是datetime。

Index.shape

返回一个元组的底层数据的形状。

Index.name

返回索引的名称。

Index.names

返回索引的名称。

Index.ndim

返回一个int数组维数代表的数量。

Index.size

返回一个int代表该对象的元素数量。

Index.nlevels

的水平指数和MultiIndex。

Index.empty

返回true,如果当前对象是空的。

Index.T

返回转置为索引,索引本身。

Index.values

返回一个数组代表数据的索引。

修改和计算

Index.all([轴,skipna])

返回所有元素是否正确。

Index.any((轴))

返回任何元素是否为真。

Index.argmin()

返回一个最小参数索引器。

Index.argmax()

返回一个最大参数索引器。

Index.copy((姓名、深))

这个对象的一个副本。

Index.delete(loc)

与通过新索引位置(- s)删除。

Index.equals(其他)

确定两个索引对象包含相同的元素。

Index.factorize([,na_sentinel])

编码对象为枚举类型或类别变量。

Index.identical(其他)

类似于等于,但检查其他类似的属性也相等。

Index.insert(loc项)

使新索引插入新项的位置。

Index.is_boolean()

返回如果当前索引类型是一个布尔类型。

Index.is_categorical()

返回如果当前索引类型分类类型。

Index.is_floating()

返回如果当前索引类型是一个浮动的类型。

Index.is_integer()

返回如果当前指数类型是整数类型。

Index.is_interval()

返回如果当前指数类型是一个间隔类型。

Index.is_numeric()

返回如果当前索引类型是数字类型。

Index.is_object()

返回如果当前指数类型是对象类型。

Index.drop(标签)

与通过新索引标签列表删除。

Index.drop_duplicates([继续])

返回索引删除了重复的值。

Index.min()

返回索引的最小值。

Index.max()

返回索引的最大价值。

Index.map(映射器[na_action])

映射值使用输入对应(dict系列,或函数)。

Index.rename(名称[,原地])

改变指数或MultiIndex名称。

Index.repeat(重复)

重复的元素索引/ MultiIndex。

Index.take(指标)

返回给定的元素位置指数沿着一个轴。

Index.unique((水平))

返回索引中惟一值。

Index.nunique([dropna,大约,rsd])

返回对象的独特的元素数量。

Index.value_counts([正常化,排序,…)

返回包含项系列独特的价值观。

兼容MultiIndex

Index.set_names(名称、级别,原地)

设置索引或MultiIndex名字。

Index.droplevel(高度)

返回索引删除请求级别(s)。

缺失值

Index.fillna(值)

NA / NaN值填充指定的值。

Index.dropna([如何])

返回索引或MultiIndex NA /南值

Index.isna()

检测现有(non-missing)值。

Index.notna()

检测现有(non-missing)值。

转换

Index.astype(dtype)

把指定dtype pandas-on-Spark对象dtype

Index.item()

返回第一个元素的底层数据作为一个python标量。

Index.to_list()

返回的列表值。

Index.to_series([名字])

创建一系列索引和索引键值等于有用地图返回一个基于索引的索引器。

Index.to_frame([指数名称])

创建一个DataFrame包含索引的列。

Index.view()

这是定义为一个复制相同的身份

Index.to_numpy([dtype,复制])

一个NumPy ndarray指数或MultiIndex代表值。

数字索引

Int64Index

不变的序列用于索引和对齐。

Float64Index

不变的序列用于索引和对齐。

CategoricalIndex

CategoricalIndex

基于一个潜在的指数分类

分类组件

CategoricalIndex.codes

这个分类的分类码。

CategoricalIndex.categories

这个分类的类别。

CategoricalIndex.ordered

类别是否有序的关系。

CategoricalIndex.rename_categories(…[…])

重命名类别。

CategoricalIndex.reorder_categories(…[…])

重新排序类别new_categories中指定。

CategoricalIndex.add_categories(new_categories)

添加新类别。

CategoricalIndex.remove_categories(删除)

删除指定的类别。

CategoricalIndex.remove_unused_categories([…])

删除未使用的类别。

CategoricalIndex.set_categories(new_categories)

将类别设置为指定的new_categories。

CategoricalIndex.as_ordered([原地])

设置分类有序。

CategoricalIndex.as_unordered([原地])

设置分类是无序的。

CategoricalIndex.map(映射)

映射值使用输入对应(dict系列,或函数)。

MultiIndex

MultiIndex

pandas-on-Spark MultiIndex对应于熊猫MultiIndex逻辑。

MultiIndex构造函数

MultiIndex.from_arrays(数组排序方式,…)

将数组转换为MultiIndex。

MultiIndex.from_tuples(元组,排序方式,…)

转换MultiIndex元组的列表。

MultiIndex.from_product(iterable […])

做一个笛卡儿积的MultiIndex多个iterable。

MultiIndex.from_frame(df[名字])

做一个从DataFrame MultiIndex。

MultiIndex属性

MultiIndex.has_duplicates

如果指数有重复,返回True,否则错误的。

MultiIndex.hasnans

如果有任何遗漏值返回True。

MultiIndex.inferred_type

返回一个字符串的类型推断值。

MultiIndex.is_all_dates

is_all_dates MultiIndex总是返回False

MultiIndex.shape

返回一个元组的底层数据的形状。

MultiIndex.names

返回索引的名称。

MultiIndex.ndim

返回一个int数组维数代表的数量。

MultiIndex.empty

返回true,如果当前对象是空的。

MultiIndex.T

返回转置为索引,索引本身。

MultiIndex.size

返回一个int代表该对象的元素数量。

MultiIndex.nlevels

的水平指数和MultiIndex。

MultiIndex.levshape

一个元组,每一层的长度。

MultiIndex.values

返回一个数组代表数据的索引。

MultiIndex.dtypes

返回dtypes作为底层MultiIndex系列。

MultiIndex组件

MultiIndex.swaplevel((i, j))

交换级别我和j。

MultiIndex组件

MultiIndex.droplevel(高度)

返回索引删除请求级别(s)。

MultiIndex缺失值

MultiIndex.fillna(值)

NA / NaN值填充指定的值。

MultiIndex.dropna([如何])

返回索引或MultiIndex NA /南值

MultiIndex修改和计算

MultiIndex.equals(其他)

确定两个索引对象包含相同的元素。

MultiIndex.equal_levels(其他)

返回True,如果MultiIndex对象的水平是一样的

MultiIndex.identical(其他)

类似于等于,但检查其他类似的属性也相等。

MultiIndex.insert(loc项)

做出新的MultiIndex插入新项的位置。

MultiIndex.drop(代码[,])

使新MultiIndex通过标签列表删除

MultiIndex.copy((深))

这个对象的一个副本。

MultiIndex.delete(loc)

与通过新索引位置(- s)删除。

MultiIndex.rename(名称[,原地])

改变指数或MultiIndex名称。

MultiIndex.repeat(重复)

重复的元素索引/ MultiIndex。

MultiIndex.take(指标)

返回给定的元素位置指数沿着一个轴。

MultiIndex.unique((水平))

返回索引中惟一值。

MultiIndex.min()

返回索引的最小值。

MultiIndex.max()

返回索引的最大价值。

MultiIndex.value_counts([正常化,排序,…)

返回包含项系列独特的价值观。

MultiIndex结合/加入/集合操作

MultiIndex.append(其他)

添加索引选项的集合在一起。

MultiIndex.intersection(其他)

形成两个索引对象的交集。

MultiIndex.union(其他[,])

两个索引对象的结合形式。

MultiIndex.difference(其他[,])

返回一个新的索引的元素索引不其他

MultiIndex.symmetric_difference(其他[…])

计算两个MultiIndex对象的对称差分。

MultiIndex转换

MultiIndex.astype(dtype)

把指定dtype pandas-on-Spark对象dtype

MultiIndex.item()

返回第一个元素的底层数据作为一个python tuple。

MultiIndex.to_list()

返回的列表值。

MultiIndex.to_series([名字])

创建一系列索引和索引键值等于有用地图返回一个基于索引的索引器。

MultiIndex.to_frame([指数名称])

创建一个DataFrame MultiIndex为列的水平。

MultiIndex.view()

这是定义为一个复制相同的身份

MultiIndex.to_numpy([dtype,复制])

一个NumPy ndarray指数或MultiIndex代表值。

DatatimeIndex

DatetimeIndex

不可变的ndarray-like datetime64数据。

时间/日期组件

DatetimeIndex.year

今年的datetime。

DatetimeIndex.month

12月1月的时间戳= 1 = 12。

DatetimeIndex.day

datetime的日子。

DatetimeIndex.hour

小时的datetime。

DatetimeIndex.minute

分钟的datetime。

DatetimeIndex.second

秒的datetime。

DatetimeIndex.microsecond

datetime的微秒。

DatetimeIndex.week

本周序数。

DatetimeIndex.weekofyear

本周序数。

DatetimeIndex.dayofweek

星期的星期一= 0,周日= 6。

DatetimeIndex.day_of_week

星期的星期一= 0,周日= 6。

DatetimeIndex.weekday

星期的星期一= 0,周日= 6。

DatetimeIndex.dayofyear

顺序的一天。

DatetimeIndex.day_of_year

顺序的一天。

DatetimeIndex.quarter

四分之一的日期。

DatetimeIndex.is_month_start

指示是否日期是这个月的第一天。

DatetimeIndex.is_month_end

指示是否日期是这个月的最后一天。

DatetimeIndex.is_quarter_start

指标是否日期是四分之一的第一天。

DatetimeIndex.is_quarter_end

指标是否日期是一个季度的最后一天。

DatetimeIndex.is_year_start

指明的日期是每年的第一天。

DatetimeIndex.is_year_end

指明的日期是今年的最后一天。

DatetimeIndex.is_leap_year

布尔指标如果日期属于一个闰年。

DatetimeIndex.daysinmonth

月的天数。

DatetimeIndex.days_in_month

月的天数。

选择

DatetimeIndex.indexer_between_time(…[…])

返回索引的位置值之间特定的一天(例如:9:00-9:30AM)。

DatetimeIndex.indexer_at_time(时间[,asof])

返回索引值的位置在一天中的特定时间(例如:)早上九时三十分。

有时限的操作

DatetimeIndex.normalize()

转换到午夜。

DatetimeIndex.strftime(date_format)

转换为一个字符串索引date_format指定使用。

DatetimeIndex.round(* * kwargs频率,* args)

对数据执行一轮操作指定的频率。

DatetimeIndex.floor(* * kwargs频率,* args)

执行地面操作的数据到指定的频率。

DatetimeIndex.ceil(* * kwargs频率,* args)

对数据执行装天花板操作指定的频率。

DatetimeIndex.month_name((地区))

返回指定地区的月DatetimeIndex的名字。

DatetimeIndex.day_name((地区))

返回天系列的名称与指定的场所。

TimedeltaIndex

TimedeltaIndex

不变的ndarray-like timedelta64数据的内部表示为int64,可以盒装timedelta对象。

组件

TimedeltaIndex.days

为每个元素的天数。

TimedeltaIndex.seconds

的秒数(> = 0和小于1天)为每个元素。

TimedeltaIndex.microseconds

数微秒(> = 0和小于1秒)为每个元素。