让我首先说我是一个Hadoop的新手。我的要求是使用Hadoop基础结构分析服务器日志文件。我在这个方向上采取的第一步是使用Flume HDFS接收器对日志文件进行流式处理并将它们原始转储到单节点Hadoop集群中。现在我有一个看起来像这样记录的一堆文件:处理HDFS文件
时间戳REQ-ID级别模块名消息
我的下一步是解析文件(分离出字段),并将它们存储回去以便他们准备好进行搜索。
我应该用什么方法呢?我可以使用Hive来做到这一点吗? (抱歉,如果问题是天真的)。互联网上可用的信息是压倒性的。