我们有数据(不是在这一点上分配),我们想要转换/聚合/转到wazoo。要hadoop或不要hadoop
我在www上看了一眼,我要求的所有答案都是指向hadoop的可扩展性,运行便宜(无需SQL服务器和许可证),快速(如果您拥有数据分配),可编程你拖动的小盒子)。
只是有一个问题,我一直来面对
现在我们甚至没有1GB的数据(在这个阶段)是即“如果你比的数据10GB有更多的只使用Hadoop”仍然可行。
我的其他选择是SSIS。现在我们使用SSIS来处理当前的一些ETL,但是我们没有资源,并且将SQL放入云中会花费很多,甚至不会让我着手可扩展性成本和配置。
谢谢
1GB不是大数据。它实际上是平均值。 10GB也不是。目前数据仓库基准测试的起始容量为100GB。一个4岁的笔记本电脑可以轻松处理10GB的负载。事实上,您可以将所有数据存储在内存中,例如SQL Server 2014或2016.至于便宜且快速的情况,只有*如果您拥有一个群集,在这种情况下,它非常便宜。 –
“除非增加5TB /年,否则您没有大数据。”这是最近一次会议的一句话。尽管Excel可以使用列存储来汇总数百万个数据行,但它不会显示*所有这些数据行都是相关的博客文章[https://www.chrisstucchio.com/blog/2013/hadoop_hatred.html] –
@Pintac :参考这篇文章:https://www-01.ibm.com/software/in/data/bigdata/和http://stackoverflow.com/questions/32538650/hadoop-comparison-to-rdbms/32546933#32546933和 –