三角洲湖是什么
三角湖优化存储层为Databricks湖中表提供基础三角湖bob下载地址开源软件扩展Parquet数据文件并基于文件的交易日志ACID事务可缩放元数据处理三角洲湖与ApachesparkAPIs完全兼容,开发是为了与结构流紧密整合,使你很容易使用单数据拷贝分批流操作并大规模提供增量处理
三角洲湖默认格式所有Databricks操作除另有说明外,Databricks上所有表都是Delta表bob下载地址Databricks原创三角湖协议并持续为开源项目作出积极贡献bob体育客户端下载Databricks平台上的许多优化和产品以Apachespark和Delta湖提供的保证为基础数据布列克优化信息见优化数据布列克建议.
三角湖SQL命令参考信息见三角洲湖语句.
Delta湖事务日志定义清晰开放协议可供系统阅读日志看吧Delta事务日志协议.
开始三角洲湖
数据键表默认为Delta表是否使用ApachesparkDataFrames数据库或SQL使用默认设置将数据保存到湖中获取三角湖所有利益
三角洲湖基本运维实例,如创建表、读写更新数据见教程:三角湖.
Databricks建议多三角洲湖最佳做法.
更新修改三角湖表
原子交易三角洲湖提供多项选项更新数据和元数据Databricks建议避免直接与Delta湖文件目录中的数据和事务日志文件交互以避免表损耗
三角湖使用合并操作支持上移看吧向三角洲湖表并发.
三角洲湖为基于滤波器和分区的选择性溢出物提供多项选项看吧选择覆盖三角洲湖数据.
可手动或自动更新表模式而不重写数据看吧更新三角湖表模式.
启动列映射重命名或删除列而不重写数据看吧重命名并下降列三角洲湖列映射.
查询表前版本
写入三角洲表创建新表版可使用事务日志审查对表的修改并查询前表版本看吧三角洲湖表历史.
三角湖特征兼容
Databricks运行时间不全三角湖版信息见Databricks如何管理三角洲湖特征兼容性.
三角湖API文档
对大多数Delta表读写操作使用sparkSQL或Apachespark数据FrameAPIs
三角湖-SQL语句见三角洲湖语句.
databricks保证Delta湖API二分兼容查看Delta湖API版本系统环境段相关文章数据布列克斯运行时发布注解.三角湖Python、Scala和JaOSS三角洲湖文档.