2017-07-06 82 views
2

我从this链接 使用此提取/消除在iMacros的重复文本

TAG POS=2 TYPE=a ATTR=CLASS:property-sticky-link&&TXT:* EXTRACT=TXT 

提取数据,但这个是给我

BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan1 BHK Apartment1 BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan1 BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan1 BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan1 BHK Apartment1 BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan1 BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan1 BHK Apartmentfor sale in1 BHK Apartmentfor sale inKalyan690 sqft 

,但我想要的只是1 BHK Apartmentfor sale inKalyan只有一次

所以试过这个SET !VAR1 EVAL("var s=\"{{!EXTRACT}}\"; s.split(' ')[-7];")

SET !VAR1 EVAL("'{{!EXTRACT}}'.match(/?BHK.: (\\d+)/)[-7];") 

但这些不起作用。

关于如何去做这件事的任何想法。

任何帮助将不胜感激。由于

回答

3

我宁愿从单个标签提取部分:

TAG XPATH=".//body/descendant::div[@class='propDBlock'][1]/descendant::a[@class='property-sticky-link']/h3" EXTRACT=txt 

结果为 “1个BHK公寓”

TAG XPATH=".//body/descendant::div[@class='propDBlock'][1]/descendant::h3/span[@class='noWrapLocality']" EXTRACT=txt 

结果: “出售的”

TAG XPATH=".//body/descendant::div[@class='propDBlock'][1]/descendant::span[@class='localityFirst']" EXTRACT=txt 

结果:“Ambernath”

TAG XPATH=".//body/descendant::div[@class='propDBlock'][1]/descendant::b[@class='areaValue']" EXTRACT=txt 

结果:“600平方英尺”

...然后您可以单独使用它们(例如,在csv文件的不同列中)或通过javascript连接它们。

您也可以在XPATH中使用[{{!LOOP}}]代替[number]。