在使用美丽页获取页面源时遇到困难

-1

import bs4 as bs 
import requests 
import urllib.request 
sourceUrl='https://www.pakwheels.com/forums/t/planing-a-trip-from-karachi-to-lahore-by-road-in-feb-2017/414115/2.html' 
source=urllib.request.urlopen(sourceUrl).read() 
soup=bs.BeautifulSoup(source,'html.parser') 
print(soup)

我想要页面的HTML源代码。这就是我现在越来越：

'ps.store("siteSettings", {"title":"PakWheels Forums","contact_email":"[email protected]","contact_url":"https://www.pakwheels.com/main/contact_us","logo_url":"https://www.pakwheels.com/assets/logo.png","logo_small_url":"/images/d-logo-sketch-small.png","mobile_logo_url":"data:image/svg+xml;base64,PD94bWwgdmVyc2lvbj0iMS4wIiBlbmNvZGluZz0idXRmLTgiPz4NCjwhLS0gR2VuZXJhdG9yOiBBZG9iZSBJbGx1c3RyYXRvciAxNi4wLjAsIFNWRyBFeHBvcnQgUGx1Zy1JbiAuIFNWRyBWZXJzaW9uOiA2LjAwIEJ1aWxkIDApICAtLT4NCjwhRE9DVFlQRSBzdmcgUFVCTElDICItLy9XM0MvL0RURCBTVkcgMS4xLy9FTiIgImh0dHA6Ly93d3cudzMub3JnL0dyYXBoaWNzL1NWRy8xLjEvRFREL3N2ZzExLmR0ZCI+DQo8c3ZnIHZlcnNpb249IjEuMSIgaWQ9IkxheWVyXzEiIHhtbG5zPSJodHRwOi8vd3d3LnczLm9yZy8yMDAwL3N2ZyIgeG1sbnM6eGxpbms9Imh0dHA6Ly93d3cudzMub3JnLzE5OTkveGxpbmsiIHg9IjBweCIgeT0iMHB4Ig0KCSB3aWR0aD0iMjQwcHgiIGhlaWdodD0iNjBweCIgdmlld0JveD0iMCAwIDI0MCA2MCIgZW5hYmxlLWJhY2tncm91bmQ9Im5ldyAwIDAgMjQwIDYwIiB4bWw6c3BhY2U9InByZXNlcnZlIj4NCjxwYXRoIGZpbGw9IiNGRkZGRkYiIGQ9Ik02LjkwMiwyMy4yODZDMzQuNzc3LDIwLjI2Miw1Ny4yNC'

来源

2017-03-31 Zeeshan Ul Haq

如果您需要原始来源，则不需要'BeautifulSoup'。 –

我需要HTML源码不是原始码 –

https://docs.python.org/3/howto/urllib2.html –

看一看这段代码：

你需要正确

from urllib import request 
from bs4 import BeautifulSoup 


url_1 = "http://www.google.com" 
page = request.urlopen(url_1) 
soup = BeautifulSoup(page) 
print(soup.prettify())

进口一切。阅读this。

来源

2017-04-08 06:21:42

在使用美丽页获取页面源时遇到困难

回答

相关问题