2016-08-16 37 views
1

我试图通过python(xbmc/kodi)来刮擦Javascript日历页面的各个部分。 到目前为止,我已经能够刮掉静态的html变量,但不是JavaScript生成的部分。XBMC(Python)问题的简单登录函数

我试图检索的变量是<strong class="item-title">**this**</strong> , <span class="item-daterange">**this**</span> and <div class="item-location">**this**</div>,请注意,它们位于html源代码的不同部分,并通过JavaScript呈现。所有他们被刮掉的变量都应该被附加到一个字符串中并显示出来。

response = net.http_GET('my URL') 
    link = response.content 
    match=re.compile('<strong class="gcf-item-title">(.+?)</strong>').findall(link) 
    for name in match: 
     name = name 
     print name 

从上面的正则表达式我可以凑只是那些变量之一,因为我需要显示所有的变量在一起字符串列表,那怎么可以呢?

我得到的页面必须预先呈现的JavaScript变量被刮了但由于我使用xbmc,我不知道我怎么可以导入额外的python库,如dryscrape来完成这件事。下载Dryscrape给我一个setup.py,初始 .py文件以及其他一些,但我怎样才能将它们全部一起使用?

谢谢。

回答

1

您的问题是关于如何在XBMC/Kodi上使用Python的方法,或者如何安装包含setup.py文件的软件包?

正是基于您正则表达式以上,如果你的项目总是<strong class="item-title">**this**</strong>你不会得到,因为你的重新模式的匹配是与类=“GCF项目标题元素。

您是否在使用或能够使用BeautifulSoup?如果您不使用它,但可以,您应该 - 在刮网站方面改变生活

+0

是的,我正在使用Beautifulsoup,而theres three div's我需要附加到一个字符串并打印,这3个是div(包括强文本)在问题中提到,他们是通过JavaScript生成的,任何想法如何我可以实现这一目标?我可以使用Beautifulsoup,但不是其他人。 –

+0

以及如何使用xbmc中的setup.py文件附带的软件包?我还没有找到如何做到这一点的答案。 –

+0

看看[这个链接](http://kodi.wiki/view/Python_libraries),看看它是否有帮助。它看起来像Kodi/XBMC希望你使用'from lib import '方法,将_init_.py文件放在** lib **文件夹中 – dblclik