SparkSession。
sql
DataFrame
arg游戏
kwargs
SQL查询字符串。
一个字典的命名参数的开始:标记和相应的Python对象的值替换。(关于可接受的Python对象的更多细节,阅读火花SQL指南主题数据类型)。
:
注意:sql ()字典的值转换为列文字表达的点燃()方法。
sql ()
列
点燃()
用户想要的其他变量,可以在查询中引用。
添加可选参数kwargs查询中指定变量的映射。这个特性实验和不稳定。
例子
执行一个SQL查询。
> > >火花。sql(“SELECT * FROM范围(10)id > 7”)。显示()+ - - - +| | id+ - - - +8 | |9 | |+ - - - +
执行一个SQL查询和一个整数参数。
> > >火花。sql(“SELECT * FROM范围(10)id >: param”,arg游戏={7}“参数”:)。显示()+ - - - +| | id+ - - - +8 | |9 | |+ - - - +
执行一个SQL查询字符串参数。
> > >火花。sql(“SELECT *从员工那里的名字=:param”,arg游戏={“参数”:“约翰”})。显示()+ - - - + - - - +| | | id名称+ - - - + - - - +约翰| 100 | |+ - - - + - - - +
执行一个SQL查询以变量为Python格式化程序标准。
> > >火花。sql(…“SELECT * FROM范围(10)id >{bound1}和id <{bound2}”,bound1=7,bound2=9…)。显示()+ - - - +| | id+ - - - +8 | |+ - - - +
> > >mydf=火花。范围(10)> > >火花。sql(…“选择{坳}从{mydf}在id{x}”,…上校=mydf。id,mydf=mydf,x=元组(范围(4)))。显示()+ - - - +| | id+ - - - +| 0 || 1 || 2 || 3 |+ - - - +
> > >火花。sql(“‘…选择m1。,m2.b…从{table1}m1内连接{表}平方米…m1。关键= m2.key…ORDER BY m1。,m2.b”,…表1=火花。createDataFrame(((1,“一个”),(2,“b”)),(“一个”,“关键”]),…表二=火花。createDataFrame(((3,“一个”),(4,“b”),(5,“b”)),(“b”,“关键”)))。显示()+ - - - + - - - +| | | b+ - - - + - - - +| 1 | 3 || 2 | 4 || 2 | 5 |+ - - - + - - - +
同时,可以查询使用类:列从DataFrame。
> > >mydf=火花。createDataFrame(((1,4),(2,4),(3,6)),(“一个”,“B”])> > >火花。sql(“选择{df.A},{df [B]}从{df}”,df=mydf)。显示()+ - - - + - - - +| | | B+ - - - + - - - +| 1 | 4 || 2 | 4 || 3 | 6 |+ - - - + - - - +
以前的
pyspark.sql.SparkSession.sparkContext
下一个
pyspark.sql.SparkSession.stop