2015-11-08 62 views
1

我想解析来自Flume/Kafka的数据。我已将Flume.conf文件配置为指向Kafka。我能够将数据文件从Flume传递给Kafka。我想知道如何解析数据以从Flume或Kafka中的数据文件中提取几个字段。有什么建议吗?谢谢如何解析Flume中的数据

+0

您的意思是将一部分字段保存到Kafka中,而不是完整的原始数据文件? – frb

+0

是的,这是正确的。任何想法? – Katie

回答

0

我想你可以创建自己的自定义Flume拦截器,以保留原始文件中的字段子集。 Flume拦截器是一段代码,它在源创建Flume事件后立即运行(配置时),并在将其放入通道之前运行;即它“拦截”该事件并在其有效地将其放入频道之前对其进行一些修改(无论是在头部中,还是在身体中)。

一旦创建,这是很容易配置,它的用法:

myagent.sources.mysource.interceptors = myinterceptor 
myagent.sources.mysource.interceptors.myintercetor.type = FQCN_of_your_interceptor_class 
myagent.sources.mysource.interceptors.myintercetor.specific_parameter_1 = whatever 
myagent.sources.mysource.interceptors.myintercetor.specific_parameter_2 = whatever 

拦截器类实现org.apache.flume.interceptor.Interceptorinterface