2011-12-04 41 views
2

我正在做一个处理大量数据的项目。我正在考虑在Ec2上主办这个项目。我打算使用Hadoop来执行计算,并使用一些NoSql系统(例如Hbase/Cassandra)来存储数据。 NoSql系统必须是持久性的(我不想丢失我的数据)。据我所知,我需要产生虚拟机来承载Hadoop和NoSql的东西。但是虚拟机并不是持久的。有没有其他的方式可以持久地存储数据存储系统(不仅是数据,还有管理数据的系统)并利用Amazon提供的计算?如何在Amazon上托管持久性数据存储系统

我想我的情况与持续托管数据库的人相似。

回答

1

我想你需要看看使用“预留实例”和“Elastic Block Store”(EBS)。

http://aws.amazon.com/ec2/reserved-instances/

http://aws.amazon.com/ebs/

如果我正确理解你的问题,你想保留的情况下,你总是保持运行连接到EBS卷为您的数据的持久化存储。 EBS能够为S3提供备份“快速预定”。

+0

我想要的是有一个持久的方式来存储数据和我可以获取数据的运行系统。根据我的理解,“预留实例”是我可以保留一段时间(至少1年)的一个实例。如果是这样的话,这可能是一个解决方案。顺便说一句,人们通常如何在云端托管他们的数据库? – user1080611

+0

直到您在EC2上开发了一个系统并确定您要在相当长的一段时间内使用相同的实例类型并且想要少付一点费用时,才需要购买预留的实例。您可以在不购买保留实例的情况下尽可能长时间使用EC2实例,并且在完成之前很可能需要更改实例类型。 –

+0

AWS不保证虽然未保留的实例。虽然它的可能性不大,但您的按需实例将会“启动”......从我的理解来看,这也不是问题。如果我在这里错了,请纠正我。 –

0

Amazon提供名为SimpleDB的服务,您可以使用该服务持久且灵活地存储数据。根据您的数据要求,您可能也可以使用Amazon S3。