我使用Heroku来托管我的电报机器人。 机器人的目的是从网页中检索html并将其转换为pdf。从Heroku上的URL检索HTML
成功托管它后,我试图发送一个URL到机器人,但它冻结/停止在发送获取请求的时刻。
代码:
logger.info('retrieving HTML = {}'.format(url))
page_html = requests.get(url)
logger.info('retrieved HTML')
logger.info('started HTML parsing')
soup = BeautifulSoup(page_html.text, 'html.parser')
在Heroku的日志,我只看到retrieving HTML = <URL>
,比应用程序不显示活动的任何迹象。
我试图连接到使用Heroku的控制台(从Heroku的网页访问)测功机(在Heroku上的应用程序本身),并输入以下代码:
import requests
# url of a recepie
url = 'https://pikabu.ru/story/pirog_quotlen__matushkaquot_5332461'
html = requests.get(url)
这个代码在执行heroku控制台也需要很长时间,并且没有完成(没有错误,没有消息,我可以用crtl + c停止进程,执行永远不会结束),并且我不确定可能是什么问题。
先谢谢您,任何提示或帮助,将不胜感激。
您是否可以加载此页:https://pikabu.ru/story/pirog_quotlen__matushkaquot_5332461 – bhansa
@bhansa是的,我可以打开它。只需在开头添加“https://” – GrimSmiler