0
音频源链接我写一个脚本来从一个网站的音频源链接。通过抓取主页面获取可用链接的列表。但是当我抓取生成的链接时,我找不到源代码。 (应该是内部的<音频>标记的HREF)。获取来自网站与Python
这里是我的代码:
# -*- coding: utf-8 -*-
import urllib.request
from bs4 import BeautifulSoup
def getHTML(st):
with urllib.request.urlopen(site+'/',timeout=100) as response:
return response.read()
site = 'http://www.e-radio.gr'
soup = BeautifulSoup(getHTML(site), 'html.parser')
# Parse Main Page And get links
lst = list()
for a in soup.body.find_all('a', {'class' : 'erplayer'}):
item = a.get('href')
if site in item:
lst.append(item)
else:
lst.append(site + item)
print("\n".join(lst))
看来,网站无法正确加载并使用urllib.request里它不会加载音频信号源。还有什么我可以使用,而不是urllib.request,所以它等待整个页面加载。我还以为是使用一些外部Web浏览器来生成HTML,但我不知道该怎么做
你可以发布你需要的链接的HTML吗?音频链接html – Exprator
网站链接在代码中。这是我的代码,你可以运行它 –
权,但如果我们运行的代码,我们可以看到印刷的音频链接。问题是什么? – alecxe