2016-06-14 996 views
1

我想从配置单元表中提取特定的列值。该列具有XML数据。如何解析XML数据并从该特定XML列中提取名称和值。另外我想将提取的数据插入到另一个Hive表中。从Hive表中提取XML数据并解析数据

+0

XpathUDF/SERDE是适合你。请检查我的答案。 –

+0

是我的回答有用吗?如果是,请标记“由所有者接受” –

回答

1

例子:

select xpath ('<a><b id="1"><c/></b><b id="2"><c/></b></a>','/descendant::c/ancestor::b/@id') from t1 limit 1 ; 
[1","2] 

在你需要有Xpath的两个选项表达知识。

如果要在另一个表中插入提取的数据,然后使用从XXXXX创建表作为选择XXX(Create Table As Select (CTAS)