我打算做一个项目来实现HBase中的所有聚合操作。但我不知道它的困难。我只有6个月的时间来完成这个项目。我应该继续吗?我打算用java来做。我知道已经有一些聚合函数。但是现在没有INNER JOIN像查询那样。我打算实施这种类型的查询。我不知道这是一个错误或虚张声势。HBase内部加入和协处理器
0
A
回答
0
HBase肯定比在RDBMS或像PIG或Hive这样的其他Hadoop技术中做得更难。
1
我想技术上我们应该区分两种类型的连接:
a)一个小表+一个大表。小表我的意思是表可以缓存在每个节点的内存中,而不会严重影响集群操作。在这种情况下,应该可以通过在散列映射中放置小表来实现使用协处理器的连接,迭代大表的数据的节点本地部分,并且以这种方式产生连接结果。在Hive的术语中,它被称为“地图”加入http://www.facebook.com/note.php?note_id=470667928919。
b)两张大桌子。我认为在短时间内获得产品质量并不可行。我可能会说,这样的功能是MPP数据库的领域,也是他们IP的重要组成部分。
相关问题
- 1. HBase的InternalScanner和过滤协处理器
- 2. HBase 0.92是否支持协处理器二级索引?
- 3. Aerospike是否有类似HBase的协处理器?
- 4. 内存映射协处理器接口
- 5. 外部协议处理程序和现代浏览器
- 6. android内部和内存/处理器的限制?
- 7. 处理ISR内部的协议,以避免原子性
- 8. 处理阻力和触摸内部onTouch
- 9. 外部和内部SQL加入
- 10. .NET批处理内部?
- 11. XSLT:处理内部XML
- 12. 处理是内部的SQL
- 13. NiFi协调器 - 处理数据
- 14. 批处理文件协议解析器
- 15. 分布式事务处理协调器
- 16. 汇编语言协处理器
- 17. 预处理器,后处理器,几何处理器和NC处理器
- 18. 获取Hbase处理器过滤器行的时间戳
- 19. 标题添加内容处理“附件”导致内部服务器错误
- 20. Python 3多处理:内部和超时错误处理和回调
- 21. 错误处理内部或外部类?
- 22. 内部加入mysql
- 23. Mysql内部加入
- 24. MapReduce内部加入?
- 25. 内部加入和SUM的SQL更新
- 26. HQL内部加入和日期查询
- 27. 内部加入,选择SUM和Where
- 28. Magento内部加入和订购
- 29. MySql内部加入和排除
- 30. SQL内部加入和子查询