goose

0热度

1回答

问题为什么会Pyinstaller不goose文件？这是可执行文件创建者还是我的代码的问题？代码 from goose.Goose import Goose url = 'http://sociedad.elpais.com/sociedad/2012/10/27/actualidad/1351332873_157836.html' g = Goose({'debug':False,'e

5热度

1回答

创建函数未终止美元引用字符串

我试图用Goose使用postgres（pq lib）数据库创建此函数。我的代码如下： CREATE OR REPLACE FUNCTION add_userlocation(user_id INT, location_id INT) RETURNS VOID AS $BODY$ BEGIN LOOP UPDATE userslocations SE

0热度

1回答

如何解决递归深度超过（鹅提取）

我一个问题鹅提取这是我的代码： for resultado in soup.find_all('a', href=True,text=re.compile(llave)): url = resultado['href'] article = g.extract(url=url) print article.title ，并看看我的问题。 RuntimeEr

0热度

2回答

我如何得到一篇文章的作者使用蟒蛇

我试图从新闻机构刮来的文章，但我无法弄清楚如何得到一篇文章的作者使用python鹅。我已阅读文档，源代码和搜索谷歌。 from goose import Goose def getArticle(url): g = Goose() article = g.extract(url=url) print article.title # print artic

1热度

1回答

无法导入蟒蛇（OSX 10.9）

我想在virtualenv中正确设置python-goose。更新：我nukin蟒蛇，并开始与干净的安装，如概述here。我跟蟒蛇鹅instructions，做： mkvirtualenv --no-site-packages goose git clone https://github.com/grangier/python-goose.git cd python-goose pip

-1热度

1回答

如何从鹅印地文网页中提取文章？

我使用Python Goose从网页中提取文章。它适用于很多语言，但对印地语不起作用。我试图添加印地语停止作为stopwords-hi.txt和设置target_language嗨，没有成功。谢谢，伊兰

0热度

1回答

从鹅提取HTML文本（除一个以外的所有工作）

我使用Goose从各种URL提取标题和主文本。它适用于大多数网址，只有一个特定的荷兰新闻网站。任何想法这里怎么了？具体问题的URL是here. 我的代码： g = Goose() content_url = g.extract(url=url) allcontent = content_url.cleaned_text print allcontent 我期待整个文本，但奇怪的是我刚刚

1热度

2回答

如何告诉python不要打印列表中的项目？

我的python脚本解析来自多个RSS源的标题和链接。我将这些标题存储在列表中，并且要确保我从不打印重复项目。我怎么做？ #!/usr/bin/python from twitter import * from goose import Goose import feedparser import time from pyshorteners import Shortener impo