0
我是新来蜂巢。我有按日期存储在文件夹中的日志:logs/2016/02/15/log-xxx.json
。我想对最后一天的日志进行日常分析。我不想在最后2-3个文件夹上运行hiveQL(时区差异)。如何有效地做到这一点?配置单元:固定的日志结构和日常分析
- 我不能告诉配置单元自动发现新日志并将它们添加为新分区,对吗?
- 我必须在每个查询之前创建外部表并稍后删除它吗?
- 有没有什么办法告诉配置单元只在指定的文件夹上运行查询而不创建任何表?
但文件夹结构是固定且只读的。我不想在每次分析前复制千兆字节。我可以添加一个任意的现有目录作为分区吗? – piotrek
东西像 ALTER TABLE测试ADD PARTITION(dt ='2014-03-05')location/user/admin/log/2014/3/5' 应该工作 – Viktor