我可以直接考虑类似于源(Teradata)表中存在的分区列的Hive分区列吗?或者我是否考虑过其他参数来决定Hive分区列?请帮忙。我可以直接考虑类似于源(Teradata)表中存在的分区列的Hive分区列吗?
0
A
回答
1
这不是最佳实践。如果以这种方式创建数据,那么试图直接访问HDFS数据的人将无法在每个分区中找到“分区列”。例如,说Teradata表被date
列分区,然后如果hive表也被date
分区,那么HDFS分区表示2016-08-06将不具有日期字段。所以为了方便最终用户对虚拟列进行分区,例如date_d
,它将与日期列的值完全相同。
0
抽象地,在Teradata和蜂巢分区是similar.To开始 与你可能在你的源使用相同的列到 分区表。
如果你的数据的大小在每个单个分区巨大的,再考虑进一步 它分区,以提高performance.The多 分区将主要取决于过滤器的数量,你在你的查询申请 。
相关问题
- 1. 我可以区分Hive中的每一列吗?
- 2. 删除HIVE中的一系列分区
- 3. Hive:需要指定分区列,因为目标表已分区
- 4. Oracle 10g分区:我可以分区一个子表吗?
- 5. 列表切片和直接分配列表之间的区别?
- 6. 表上的Hive分区
- 7. 计算列上的Hive分区修剪
- 8. Hive Table分区,中间有列
- 9. 分区给定的总的分区和分区数的列表
- 10. 我可以使用java api修改Hive分区位置吗?
- 11. Spark-Hive分区
- 12. Hadoop/Hive中是否有类似Oracle的分区?
- 13. Sqoop导出分区Hive表
- 14. 区分数据源中的列
- 15. Sqoop - 基于oracle分区表架构创建空的hive分区表
- 16. 列表框的分区?
- 17. Python - 在位列表分区
- 18. 改变分区的Hive动态分区表问题
- 19. HDFS vs HIVE分区
- 20. 我可以在SQL Server 2005中更改分区表吗?
- 21. 通配符的Hive分区
- 22. 如何使用Hive HQL创建分区表'像'未分区表?
- 23. Spark分区:创建RDD分区,但不创建Hive分区
- 24. 如何获得Hive表的分区列名称
- 25. 如何列出Hive表的分区修剪输入?
- 26. 如何使用列的值范围对Hive表进行分区
- 27. 我可以区分不同输入类型的CSS吗?
- 28. 我可以直接写入OpenGL中的颜色缓冲区吗?
- 29. Sqoop导出分区的Hive表
- 30. python中的分区排列