pyspark.sql.DataFrame.select

DataFrame。 选择 ( *关口:ColumnOrName )→DataFrame

项目一组表达式并返回一个新的DataFrame

参数
关口 str,,或列表

列名(字符串)或表达式()。如果其中一个列名是‘*’,这一列是当前扩大到包括所有列DataFrame

例子

> > >df选择(‘*’)收集()行(= 2岁name =“爱丽丝”)、行(= 5岁name = '鲍勃'))> > >df选择(“名字”,“年龄”)收集()行(name =“爱丽丝”,年龄= 2),行(name =“鲍勃”、年龄= 5)]> > >df选择(df的名字,(df年龄+10)别名(“年龄”))收集()行(name =“爱丽丝”,年龄= 12),行(name =“鲍勃”、年龄= 15))