0
我正在使用hadoop map-reduce。我必须处理来自.xml
文件的数据,解析它并将输出存储到数据库中。
为什么XmlInputFormat不是由hadoop提供的?
虽然这方面的工作时,我需要通过我的XML映像器,我发现XmlInputFormat.class
没有被默认的Hadoop提供的,我们必须使用象夫的它XmlInputFormat。
我想知道Xml何时被广泛使用,为什么hadoop没有提供这个XmlInputFormat
而不是明确地创建定制的XmlInputFormat bye,为它延长TextInputFormat
?
感谢您的宝贵意见。但是对于JSON,在java中也有提供,因此我对mapreduce很感兴趣,因为大部分时间数据都是json或xml格式。但是你给出的描述非常确定。 – Nakul91
Ya,json和xml是独立的,像python和java这样的语言需要与它们交互,因此我们分别使用Jackson和jaxb来分别使用json和xml。所以像hadoop这样的框架给出了使用RecordReader概念处理它们的相同选项。希望我在这方面帮助你。快乐学习 – Ramzy