2010-09-22 59 views
0

我需要一个概念,我如何将D-Pool中的所有数据存档为一年以上。 目前我们在D-Pool中有超过300万条记录。 由于大数据基础对数据库的搜索和过滤需要相当长的时间,因为大多数搜索都是在整个D-Pool数据上完成的,但在大多数情况下,我只对当前数据感兴趣。 所以我想定期存档D池中当前工作和评估不需要的所有数据。 但是对于某些功能,应该可以进一步搜索整个D池,当前数据和旧数据。用于归档大型数据库的概念

你能告诉我一些关于这个问题的想法吗?

回答

1

这描述了典型的数据仓库解决方案。大多数每天更改的大型数据集的所有者都拥有事务数据库和历史或报告数据库。历史数据库或报告数据库允许用户针对所有内容进行洞察 - 除了自上次提取以来添加的数据。这通常就足够了。