三角洲表属性引用
湖储备δ表属性入手三角洲。
。这些属性可能有特定的含义,并影响行为时,这些属性集。
表属性和SparkSession交互属性怎么样?
δ表属性设置每个表。如果一个属性设置在一个表上,那么这是紧随其后的是默认的设置。
有些表属性关联SparkSession总是优先于表属性的配置。一些例子包括spark.databricks.delta.autoCompact.enabled
和spark.databricks.delta.optimizeWrite.enabled
汽车压实和优化配置,打开写SparkSession层面而不是表级别。砖建议使用table-scoped配置对于大多数工作负载。
对每一个增量表属性可以设置一个默认值为新表使用SparkSession配置,覆盖内置的默认。这个设置只影响到新表,不覆盖或替换现有表的属性设置。中使用的前缀SparkSession不同属性中使用的配置表,如下表所示:
三角洲湖相依 |
SparkSession相依 |
---|---|
|
|
例如,设置delta.appendOnly=真正的
财产所有新三角洲湖表中创建一个会话,设置如下:
集火花。砖。δ。属性。违约。appendOnly=真正的
修改现有表的表属性,使用设置TBLPROPERTIES。
三角洲表属性
可用三角洲表属性包括以下:
财产 |
---|
看到三角洲表属性引用。 数据类型: 默认值: |
看到汽车压实对砖三角洲湖。 数据类型: 默认值:(一) |
看到优化为三角洲湖砖。 数据类型: 默认值:(一) |
看到在检查站管理列级统计。 数据类型: 默认值: |
看到在检查站管理列级统计。 数据类型: 默认值:(一) |
是否支持增量表列和列映射相应的拼花列使用不同的名称。 注意:启用 数据类型: 默认值: |
列数为三角洲湖为跳过数据收集统计信息。的值 数据类型: 默认值: |
最短的时间前三角洲湖保持逻辑删除数据文件删除。这是为了防止失败后在陈旧的读者紧凑排列或分区覆盖。 这个值应该足够大,以确保:
数据类型: 默认值: |
看到使改变数据提要。 数据类型: 默认值: |
一个事务的程度必须隔绝的修改由并发事务。 有效的值 看到隔离级别和写冲突砖。 数据类型: 默认值: |
三角洲的历史表保存多长时间。 每次写的一个检查站,三角洲湖自动清理日志条目超过保留时间间隔。如果将此属性设置为一个足够大的价值,许多日志条目被保留。这应该不会影响性能,操作日志是常数时间。历史上的操作是平行但日志大小增加将变得更加昂贵。 数据类型: 默认值: |
最低要求协议版本为读者,让读者阅读从δ表。 数据类型: 默认值: |
作家的最低要求协议版本为一个作家可以写这个δ表。 数据类型: 默认值: |
数据类型: 默认值: |
当 数据类型: 默认值: |
最短的时间内新快照将保留事务标识符(例如, 数据类型: 默认值:(一) |
目标文件大小的字节或更高的单位文件调优。例如, 数据类型: 默认值:(一) |
数据类型: 默认值:(一) |