请帮我理解在HBase中存储信息的最佳方式。 基本上,我有一个rowkey,如hashed_uid + date + session_id,其中包含持续时间,日期,时间,位置,深度等指标。 我读了很多材料,我有点困惑。人建议少列家人有更好的表现,所以我面临的三个选项中进行选择:hbase设计concat长键值对vs多列
让每个指标在一排坐在像
rowkey_key cf1->alias1:value
有很多列像
rowkey cf1->key1:val1, cf1->key2:val2 ...
将所有键值对编码为一个大字符串,如
rowkey cf1->"k1:v1,k2:v2,k3:v3..."
预先感谢您。我不知道该选哪个。我的HBase设计的目标是为用户分析输出的增量窗口函数做准备,如过去60天的百分位数,参与度和统计摘要。很可能,我会为此使用配置单元。
我首先会问你为什么要使用hbase。 – Andrew
@Andrew是的,我目前的进程是在HDFS中,而且容量太大,无法处理。其次,我只发现HBASE可用于更好的增量计算和快照。 – Tadelicious