我有一些问题网站刮美丽的汤一些数据,我想知道如果你们任何刮板专业人士可以给我一些指导。来自coinmarketcap.com的网络刮历史比特币数据
这是确切的网页,我想凑: https://coinmarketcap.com/currencies/bitcoin/historical-data/?start=20130428&end=20171013
具体来说,我想抓住历史价格的表格并以某种方式提取信息到数据帧。但首先我需要在原始html中实际找到它。
import requests
from bs4 import BeautifulSoup
data = requests.get('https://coinmarketcap.com/currencies/bitcoin/historical-data/?start=20130428&end=20171013')
soup = BeautifulSoup(data._content, 'html.parser')
不幸的是,我发现了一个编码错误
UnicodeEncodeError: 'ascii' codec can't encode character '\xa0' in position 22075: ordinal not in range(128)
是有办法基本上只是去掉所有无法通过原始HTML美丽的汤之前进行编码的字符?