pyspark.pandas.DataFrame.drop_duplicates???

数据Frame 下拉复用 高山市 子集:Union[或,或,或,或,或]List=无, 保留:联盟[布卢尔,字符串万事通=首选, 内置:布卢尔=虚伪, 忽略索引:布卢尔=虚伪 )QQ可选 [pyspark.pandas.frame.DataFrame 万事通 ???

返回数据Frame并删除重复行,可选择只考虑某些列

参数解析

回归

             >>>df=ss系统.数据Frame高山市.
            

             >>>dfab
            

             >>>df.下拉复用(b).sort_index(b)ab
            

             >>>df.下拉复用高山市忽略索引=真实性).sort_index(b)ab
            

             >>>df.下拉复用高山市'a').sort_index(b)ab
            

             >>>df.下拉复用〔'a','b').sort_index(b)ab
            

             >>>df.下拉复用高山市保留=上传).sort_index(b)ab
            

             >>>df.下拉复用高山市保留=虚伪).sort_index(b)ab
            

前一

pyspark.pandas.DataFrame.droplevel

下一个

pyspark.pandas.DataFrame.duplicated