pyspark.pandas.MultiIndex¶

类 pyspark.pandas。 MultiIndex ¶

pandas-on-Spark MultiIndex对应于熊猫MultiIndex逻辑。这也许能引发列内部。

参数

水平序列的数组: 每一层的独特的标签。
代码序列的数组: 整数为每个级别指定哪个标签在每个位置。
排序方式 可选的int: sortedness水平(必须由这一水平按字母排序)。
的名字 可选对象序列: 名称为每个索引的水平。(名字是接受兼容)。
复制 bool,默认的错误: 复制元数据。
verify_integrity bool,默认的真: 检查水平/代码是一致的和有效的。

另请参阅

MultiIndex.from_arrays: MultiIndex转换列表的数组。
MultiIndex.from_product: 创建一个笛卡儿积的MultiIndex iterable。
MultiIndex.from_tuples: MultiIndex转换的元组列表。
MultiIndex.from_frame: 做一个从DataFrame MultiIndex。
指数: 一个单一索引。

例子

           > > >ps。DataFrame({“一个”:(“一个”,“b”,“c”)},指数=[[1,2,3),(4,5,6]])。指数MultiIndex ([(1、4)(2、5),(3、6)),)
          

           > > >ps。DataFrame({“一个”:(1,2,3)},指数=(列表(“abc”),列表(“def”)))。指数MultiIndex ([(' a ', ' d '),(' b ', ' e '),(' c ', ' f ')),)
          

方法

`所有`(* * kwargs * args)	返回所有元素是否正确。
`任何`(* * kwargs * args)	返回任何元素是否为真。
`附加`(其他)	添加索引选项的集合在一起。
`argmax`()	返回一个最大参数索引器。
`argmin`()	返回一个最小参数索引器。
`asof`(标签)	返回标签从索引中,或者,如果不存在,那么前一个。
`astype`(dtype)	把指定dtype pandas-on-Spark对象`dtype`。
`复制`((深))	这个对象的一个副本。
`删除`(loc)	与通过新索引位置(- s)删除。
`区别`(其他[,])	返回一个新的索引的元素索引不其他。
`下降`(代码[,])	使新MultiIndex通过标签列表删除
`drop_duplicates`([继续])	返回MultiIndex删除重复的值。
`droplevel`(高度)	返回索引删除请求级别(s)。
`dropna`([如何])	返回索引或MultiIndex NA /南值
`equal_levels`(其他)	返回True,如果MultiIndex对象的水平是一样的
`=`(其他)	确定两个索引对象包含相同的元素。
`因式分解`([,na_sentinel])	编码对象为枚举类型或类别变量。
`fillna`(值)	NA / NaN值填充指定的值。
`from_arrays`(数组、排序方式、名称)	将数组转换为MultiIndex。
`from_frame`(df[名字])	做一个从DataFrame MultiIndex。
`from_product`(iterable[,排序方式,名字])	做一个笛卡儿积的MultiIndex多个iterable。
`from_tuples`(元组,排序方式,名字)	转换MultiIndex元组的列表。
`get_level_values`(高度)	返回所请求的标签值向量,等于指数的长度。
`holds_integer`()	是否类型是整数类型。
`相同的`(其他)	类似于等于,但检查其他类似的属性也相等。
`插入`(loc项)	做出新的MultiIndex插入新项的位置。
`十字路口`(其他)	形成两个索引对象的交集。
`is_boolean`()	返回如果当前索引类型是一个布尔类型。
`is_categorical`()	返回如果当前索引类型分类类型。
`is_floating`()	返回如果当前索引类型是一个浮动的类型。
`is_integer`()	返回如果当前指数类型是整数类型。
`is_interval`()	返回如果当前指数类型是一个间隔类型。
`is_numeric`()	返回如果当前索引类型是数字类型。
`is_object`()	返回如果当前指数类型是对象类型。
`is_type_compatible`(一)	索引类型是否与所提供的类型兼容。
`型号`(值)	检查是否值包含在系列或索引。
`并网发电`()	检测现有(non-missing)值。
`isnull`()	检测现有(non-missing)值。
`项`()	返回第一个元素的底层数据作为一个python tuple。
`地图`([mapper, na_action])	映射值使用输入对应(dict系列,或函数)。
`马克斯`()	返回索引的最大价值。
`最小值`()	返回索引的最小值。
`notna`()	检测现有(non-missing)值。
`notnull`()	检测现有(non-missing)值。
`nunique`([dropna,大约,rsd])	返回对象的独特的元素数量。
`重命名`(名称[,原地])	改变指数或MultiIndex名称。
`重复`(重复)	重复的元素索引/ MultiIndex。
`set_names`(名称、级别,原地)	设置索引或MultiIndex名字。
`转变`([时期,fill_value])	转变系列/索引所需数量的时期。
`排序`(* * kwargs * args)	使用sort_values代替。
`sort_values`([return_indexer,提升])	返回一个分类指数的副本,并可选地返回排序索引本身的指标。
`swaplevel`((i, j))	交换级别我和j。
`symmetric_difference`(其他,result_name])	计算两个MultiIndex对象的对称差分。
`取`(指标)	返回给定的元素位置指数沿着一个轴。
`to_frame`([指数名称])	创建一个DataFrame MultiIndex为列的水平。
`to_list`()	返回的列表值。
`to_numpy`([dtype,复制])	一个NumPy ndarray指数或MultiIndex代表值。
`to_pandas`()	返回一个熊猫MultiIndex。
`to_series`([名字])	创建一系列索引和索引键值等于有用地图返回一个基于索引的索引器。
`tolist`()	返回的列表值。
`转置`()	返回转置为索引,索引本身。
`联盟`(其他[,])	两个索引对象的结合形式。
`独特的`((水平))	返回索引中惟一值。
`value_counts`([正常化,排序,提升,…))	返回包含项系列独特的价值观。
`视图`()	这是定义为一个复制相同的身份

属性

`T`	返回转置为索引,索引本身。
`asi8`	整数表示的值。
`dtype`	返回dtype底层数据的对象。
`dtypes`	返回dtypes作为底层MultiIndex系列。
`空`	返回true,如果当前对象是空的。
`has_duplicates`	如果指数有重复,返回True,否则错误的。
`hasnans`	如果有任何遗漏值返回True。
`inferred_type`	返回一个字符串的类型推断值。
`is_all_dates`	is_all_dates MultiIndex总是返回False
`is_monotonic`	返回布尔值的对象是单调递增的。
`is_monotonic_decreasing`	返回布尔值的对象是否单调下降。
`is_monotonic_increasing`	返回布尔值的对象是单调递增的。
`is_unique`	返回如果指数具有独特的价值。
`levshape`	一个元组,每一层的长度。
`的名字`	返回索引的名称。
`的名字`	返回索引的名称。
`ndim`	返回一个int数组维数代表的数量。
`nlevels`	的水平指数和MultiIndex。
`形状`	返回一个元组的底层数据的形状。
`大小`	返回一个int代表该对象的元素数量。
`值`	返回一个数组代表数据的索引。

以前的

pyspark.pandas.CategoricalIndex.map

下一个

pyspark.pandas.MultiIndex.from_arrays