2017-05-26 78 views
-2

我有产品名称列表,我想在以下给定的URL中搜索产品名称,我只需要获取价格。 例如我想搜索“TOMMEE TIPPEE一次性乳垫 - 1×50包” 这个URL http://www.boots.ie/baby-child/babyfeeding/breastfeeding-pumps 如果我得到了全成匹配,那么我怎样才能得到的价格即€8.49 通过刮。 这是演示URL的一个同样地,我有URL列表正则表达式搜索产品名称并获得价格

请帮我提供任何实例或正则表达式来做好这项工作

+1

的StackOverflow是不是免费的代码服务。显示您尝试过的内容以及您的代码中卡在哪里。并指出你的问题到那个特定的问题。 –

+2

此外,我建议发布数据的摘录而不是链接到网站。您可能将该网站与好意联系起来,但它可能会被滥用于广告或恶意软件传播,这会使我保持警惕,并且不太可能回答您的问题。 – Aaron

回答

0

几个示例代码,可以帮助您开始这个项目。

import re 
from bs4 import BeautifulSoup 

url = 'http://www.boots.ie/baby-child/babyfeeding/breastfeeding-pumps' 
soup = BeautifulSoup(url, 'html.parser') 
product_name_regex = 'Tommee Tippee Disposable Breast Pads - 1 x 50 Pack' 
product_tag = soup.find('div', text=re.compile(product_name_regex)) 
price_tag = product_tag.find_next('div', { "class" : "product_price" }) 
price = price_tag.text 

这个简短的代码试图首先解析HTML页面,然后通过使用文本/类名查找标签提取该页面的信息。

几个环节,可以帮助你: BeautifulSoup DocHow to find elements by class

+0

Hi @Flames 这是正确的答案。我认为这个库是为Python,但我需要在C#。有没有在C#或Java脚本中可用的lib。 –

+0

感谢您给我想法在HtmlAgilityPack的解决方案 –

+0

@AdeelNazir没问题。 – Flames