我有产品名称列表,我想在以下给定的URL中搜索产品名称,我只需要获取价格。 例如我想搜索“TOMMEE TIPPEE一次性乳垫 - 1×50包” 这个URL http://www.boots.ie/baby-child/babyfeeding/breastfeeding-pumps 如果我得到了全成匹配,那么我怎样才能得到的价格即€8.49 通过刮。 这是演示URL的一个同样地,我有URL列表正则表达式搜索产品名称并获得价格
请帮我提供任何实例或正则表达式来做好这项工作
我有产品名称列表,我想在以下给定的URL中搜索产品名称,我只需要获取价格。 例如我想搜索“TOMMEE TIPPEE一次性乳垫 - 1×50包” 这个URL http://www.boots.ie/baby-child/babyfeeding/breastfeeding-pumps 如果我得到了全成匹配,那么我怎样才能得到的价格即€8.49 通过刮。 这是演示URL的一个同样地,我有URL列表正则表达式搜索产品名称并获得价格
请帮我提供任何实例或正则表达式来做好这项工作
几个示例代码,可以帮助您开始这个项目。
import re
from bs4 import BeautifulSoup
url = 'http://www.boots.ie/baby-child/babyfeeding/breastfeeding-pumps'
soup = BeautifulSoup(url, 'html.parser')
product_name_regex = 'Tommee Tippee Disposable Breast Pads - 1 x 50 Pack'
product_tag = soup.find('div', text=re.compile(product_name_regex))
price_tag = product_tag.find_next('div', { "class" : "product_price" })
price = price_tag.text
这个简短的代码试图首先解析HTML页面,然后通过使用文本/类名查找标签提取该页面的信息。
几个环节,可以帮助你: BeautifulSoup Doc , How to find elements by class
Hi @Flames 这是正确的答案。我认为这个库是为Python,但我需要在C#。有没有在C#或Java脚本中可用的lib。 –
感谢您给我想法在HtmlAgilityPack的解决方案 –
@AdeelNazir没问题。 – Flames
的StackOverflow是不是免费的代码服务。显示您尝试过的内容以及您的代码中卡在哪里。并指出你的问题到那个特定的问题。 –
此外,我建议发布数据的摘录而不是链接到网站。您可能将该网站与好意联系起来,但它可能会被滥用于广告或恶意软件传播,这会使我保持警惕,并且不太可能回答您的问题。 – Aaron