2008-11-21 58 views
2

问题声明: 我想创建一个离线数据库来查找美国销售的n本最有用的图书的价格/信息(其中n可能是300万或所以)。使用亚马逊AWS创建离线数据库

问: 所以,我的问题是(我愿意接受其他的方法在这里也一样),我试图找出如何使用Amazon AWS下载的N higest salesrank书籍清单出售以及有关该书的一些信息(即标题,价格等)。

我迄今所做的: 首先,这样的事情已经存在(asellertool.com),但是,我认为这将是一个有趣的项目上工作,并坦率地说,我们尚不够需要支付$ 30 /月的订阅。

现在,AWS很棒(也很容易),如果你有几件东西你想查找,但我似乎无法弄清楚如何枚举销售排名。 最初,我希望列举出亚马逊通过ISBN所有的书籍。但是那也没有。然后我想我可以找到所有ISBN号码的列表,但那也是一个死胡同。最后,我想我可以创建我自己的ISBN号码列表,但正如我对信封计算做了一些回应,我认为它更好,因为我的解决方案需要大约一年的时间才能通过100 /第二(无论如何它是过度杀伤)。

所以,我回到了销售排行榜上,目前它似乎也是一个死胡同。所以,如果您有任何想法,我将不胜感激。

+0

当你说“需要”时,我想它更像我的孩子,他们真的是“想要”。而且你不需要付出足够的钱来支付30美元。我想知道为什么打扰所有的时间写一个问题...;) – 2008-11-22 23:29:04

回答

1

亚马逊有一个数据馈送服务,您可以使用它包含基于顶级类别的所有产品的GZipped xml文件。它每天更新一次,总计大约20GB/110GB的压缩/未压缩数据。由于您只需要书本,因此它在4GB/31GB的区域更多。唯一的问题是我不确定谁能够使用此功能以及获取帐户涉及的内容。据我所知,他们没有在他们的网站上列出任何关于此事的信息,因此您很可能必须联系某人以了解更多信息。我们在工作中使用它来处理与他们一起做的事情,这是我必须做的最疯狂的xml处理。

0

我想知道您想使用哪一种Amazon AWS服务?或者你不知道?

为什么你需要离线数据库?为什么不提出你需要的一切请求并做一些临时缓存?

+0

原因是因为当查找ISBN的时候,PDA不会在线。例如,这可以在书店中使用。 – 2008-12-12 23:42:27

+0

那你想用什么样的数据库呢? – 2008-12-16 12:21:50

+1

适用于Windows Mobile或SQLite的PDA SQL Compact将成为数据库的最佳选择。 – balexandre 2008-12-28 23:21:40

0

我不是程序员,但好奇又便宜。 Asellerstool可能很棒,但是 如果不是亚马逊免费的数据库,它们将不在身边。那么,我想没人关心 旧书价格?