2013-10-04 87 views
0

好吧,让我们试着更详细地解释这一点。 我正在开发飞机诊断系统。假设飞机有6到8台车载电脑。每台计算机有超过200个不同的参数。诊断系统以二进制格式包接收所有这些参数,然后根据公式(到km,km/h,rpm,min,sec,pascals等)传输数据并将其以某种方式存储在数据库中。新数据必须每10-20秒处理一次并再次存储在持久性中。 我们存储数据以进一步分析处理。什么是存储高度参数化实体的最佳方式?

存储的要求:

  • 支持拆分和复制
  • 快读:支持B树索引
  • NOSQL
  • 快写

所以,我计算的平均每台平面磁盘或RAM使用量。这是大约10 - 20 MB的数据。所以估计的负载是每天100架飞机或每天2GB的数据。

似乎要将所有数据存储在RAM(memcached-liked存储:redis,membase)中并不合适(太昂贵)。但是,现在我正在寻找到mongodb方面。由于它可以用作RAM和磁盘使用,它支持所有需求。

请分享您的经验和建议。

+0

你想用什么工具分析数据?如果是OLAP,那么就需要一个传统的SQL接口。可以针对HBase或Hadoop使用Hive。针对mongo需要map-reduce。 –

+0

谢谢@NeilMcGuigan的贡献。对于分析,我希望使用[storm](https://github.com/nathanmarz/storm)(基于java)处理预汇总数据。由于它易于分布并保证可用性。你怎么看 ?请你更具体一些,请!我需要更多的细节,可能是你已经涉及的用例。 –

+0

您需要存储数据多长时间(因为实时分析)? 你需要随机读取能力吗? 只需将数据放入HDFS(Hadoop文件系统)即可。 –

回答

相关问题