cohort可视化

群解分析研究预定群落结果,即群集进程通过一系列阶段组群图签名特征是它对比变量变化横跨两个不同时间序列举例说,常见群定义即用户注册周期和日使用模式实例包括:

  • 每月硬盘故障统计

  • 每周供应商交付性能

  • 月均GPA

有多种方法定义Chort分析阶段,Databricks支持组群日度、周度或月度可视化databricks群列图比较组群在给定期间的测量量与组群初始人口规模

数据格式

Databricks期望输入样本有下列字段:

  • 日期(bucket)日期识别群假设你通过登录日期视觉化用户活动2018年1月注册所有用户组日期为2018年1月1日2月注册用户组日期为2月1日2018

  • 阶段性计数自组日期起多级采样注册月对用户分组时,您的阶段将是自用户注册起数月在上述例子中,7月对用户活动测量一月注册后将产生7值,因为1月到7月共分七个阶段

  • 相位值:你实际测量该组在给定阶段的性能上例中,如果30名用户注册一月显示7月活动

  • 桶群规模:分母计算组群目标满意度百分比继续上面的例子,如果72用户在1月注册,桶尺寸为72可视化化时,值显示为41.67%高山市32码÷72)

  • 时间间隔:允许选择对分组定义日度、周度或月度

cohort日期注解

数据bricks期望值日期显示列全日期值逐月分组2018-01-18缩到2018-01-01或任何其他全日期一月,2018-01.

组装可视化器前将所有日期和时间值转换为GMT为了避免生成问题,您应该调整从数据库返回日期由本地UTC偏移