这是我的数据集 品牌名称其次是价格在$符号我是在猪编程,我会加载下面的数据集
Apple iPhone 6s Plus 16GB Space Gray T-Mobile Smartphone 2 cases + Box:
Iphone 6s 16gb rose gold factory unlocked:$280
iPhone 6s 64gb T-Mobile:$350
Iphone 6S Plus 64 GB Space Gray Sprint International Unlocked:$385
iPhone 6s plus 64gb unlocked.:$600
,当我使用此命令加载此数据:
grunt> scrap1 = LOAD '/user/vickysmartboy15/hadoop-test1/scrap.txt' USING org.apache.pig.piggybank.storage.MyRegExLoader('([^\\:]+):([^\\:])') as (Name:chararray, price:chararray);
使用查看数据后:转储操作
我的结果是这样
(Apple iPhone 6s Plus 16GB Space Gray T-Mobile Smartphone 2 cases + Box,$)
(Iphone 6s 16gb rose gold factory unlocked,$)
(iPhone 6s 64gb T-Mobile,$)
(Iphone 6S Plus 64 GB Space Gray Sprint International Unlocked,$)
(BRAND NEW Apple iPhone 6S 32Gb Silver Verizon UNLOCKED Clean ESN,$)
(iPhone 6s plus 64gb unlocked.,$)
只有$
不显示编号。
我该如何解决这个问题?
发生了什么错误? – TKHN
Sry对于上一个问题,这是实际发生的事情。 – vicky15
在第一行中,':'后面没有任何内容。没有价格。请用正确的数据更新问题。另外,使用'PigStorage(':')'而不是使用RegEx加载器,你应该没问题。 – philantrovert