2017-05-05 75 views
0

我想了解一些关于HBase架构设计的建议。例如,有2000名患者,1名。每名患者都有姓名,性别,年龄,hospital_ID。 2.每位患者将记录活动数据,例如每分钟的心脏位数,位置和步数。 3.每位患者将接受几份调查问卷。HBase架构设计示例

如何组织HBase表?

非常感谢您的帮助

我现在的想法是使用patient_ID作为行键。每个病人在HBase表中只有一行。但是,所有的活动数据都将被分组在嵌套表格中。活动数据表将包含数百万行。 所以,表格将有三列家族。 CF1:info,CF2:activity_data,CF3:问卷。

然后, CF1:信息包括(姓名,性别,年龄,ID)

CF2:activity_data(数据(嵌套表))

CF3:问卷(questionnaired_ID(嵌套表))

我不知道这是否是一种设计HBase架构的巧妙方法。 请给我一些建议。

非常感谢您

回答

0
  1. 当你设计数据模型,它是非常重要的是了解数据的使用,特别是其对存储在数据查询你想高效地运行(不包括全表扫描) HBase的。
  2. activity_data似乎是一个原始数据,但其他两个部分与“病人档案”相关。有一个recommendation可以在同一个表中保留或多或少相同大小的列族。那么最好将activity_data保存在不同的表格中,然后聚合,让我们说每日总结并将结果存储在“患者个人资料”表格中。

我希望它有帮助。