我打算编写一个windows服务,它包含Twitter流式API,将特定主题的tweets和相关信息(情感评分,推特用户,创建日期)保存到一个天蓝色的存储。我需要一种查询这些信息的方法,比如“”显示了最近24小时内鸣叫的平均情绪得分“,因此SQL或LINQ必须可用。用于保存推文和相关信息的Azure存储
一些数字:
- 每天大约节省鸣叫的次数。 20.000
- 保存3个月的数据(20.000鸣叫* 90天)
- 数据保存:推文文字(140个字),景气指数,Twitter用户名,日期(也许有更多的属性)
- 变频节能:由于我正在使用流式API,我实时得到推文,这些推文必须保存到存储中。
- 查询频率:大约每30分钟一次。
我想知道哪种Azure存储适用于此目的。我想我必须在Azure表存储和SQL数据库之间做出决定。
真的没有正确的答案,卡尔,只是意见。另外这是一个非常广泛的问题。您只列出了一个示例查询。在决定之前,你真的需要考虑所有的查询场景。此外,它可能有助于扩大您的数据库选择到各种其他数据库引擎,而不仅仅是表存储(键/值)和SQL Azure(关系)。 –
脱离主题评论,但前段时间我检查了Twitter的服务条款并在云端数据库中存储推文(例如Azure Table Storage)在当时被禁止。在开始项目之前,您可能需要再次检查他们的TOS。 –