goose

    0热度

    1回答

    问题 为什么会Pyinstaller不goose文件?这是可执行文件创建者还是我的代码的问题? 代码 from goose.Goose import Goose url = 'http://sociedad.elpais.com/sociedad/2012/10/27/actualidad/1351332873_157836.html' g = Goose({'debug':False,'e

    5热度

    1回答

    我试图用Goose使用postgres(pq lib)数据库创建此函数。 我的代码如下: CREATE OR REPLACE FUNCTION add_userlocation(user_id INT, location_id INT) RETURNS VOID AS $BODY$ BEGIN LOOP UPDATE userslocations SE

    0热度

    1回答

    我一个问题鹅提取 这是我的代码: for resultado in soup.find_all('a', href=True,text=re.compile(llave)): url = resultado['href'] article = g.extract(url=url) print article.title ,并看看我的问题。 RuntimeEr

    0热度

    2回答

    我试图从新闻机构刮来的文章,但我无法弄清楚如何得到一篇文章的作者使用python鹅。我已阅读文档,源代码和搜索谷歌。 from goose import Goose def getArticle(url): g = Goose() article = g.extract(url=url) print article.title # print artic

    1热度

    1回答

    我想在virtualenv中正确设置python-goose。 更新:我nukin蟒蛇,并开始与干净的安装,如概述here。 我跟蟒蛇鹅instructions,做: mkvirtualenv --no-site-packages goose git clone https://github.com/grangier/python-goose.git cd python-goose pip

    -1热度

    1回答

    我使用Python Goose从网页中提取文章。它适用于很多语言,但对印地语不起作用。我试图添加印地语停止作为stopwords-hi.txt和设置target_language嗨,没有成功。 谢谢,伊兰

    0热度

    1回答

    我使用Goose从各种URL提取标题和主文本。它适用于大多数网址,只有一个特定的荷兰新闻网站。任何想法这里怎么了? 具体问题的URL是here. 我的代码: g = Goose() content_url = g.extract(url=url) allcontent = content_url.cleaned_text print allcontent 我期待整个文本,但奇怪的是我刚刚

    1热度

    2回答

    我的python脚本解析来自多个RSS源的标题和链接。我将这些标题存储在列表中,并且要确保我从不打印重复项目。我怎么做? #!/usr/bin/python from twitter import * from goose import Goose import feedparser import time from pyshorteners import Shortener impo