我有一些问题网站刮美丽的汤一些数据,我想知道如果你们任何刮板专业人士可以给我一些指导。 这是确切的网页,我想凑: https://coinmarketcap.com/currencies/bitcoin/historical-data/?start=20130428&end=20171013 具体来说,我想抓住历史价格的表格并以某种方式提取信息到数据帧。但首先我需要在原始html中实际找到它。 i
当运行我的代码,我得到这个错误 UnicodeEncodeError: 'ascii' codec can't encode character '\u0303' in position 71: ordinal not in range(128) 这是我的全部代码, from urllib.request import urlopen as uReq
from urllib.request im
district_name= [[li.getText() for li in data_rows[i].findAll('li')]
for i in range(len(data_rows))]
上面的代码给出了一个州比哈尔邦的地区名称列表。像下面的表一样。 [['1', 'Nalanda'],
['2', 'Patna'],
['3', 'Gaya'],
['4',
现在我试图从网页上刮掉所有的url。它共有5个类别,每个类别都有不同的页面(每页有10篇文章)。 例如: Categories Pages
Banana 5
Apple 14
Cherry 7
Melon 6
Berry 2
代码: import requests
from bs4 import BeautifulSoup
import re
from ur