html-parsing

2热度

1回答

摇运行验证，并得到了一些错误。 f<!DOCTYPE html>↩ ↩ <html class="no-js" lang

-1热度

2回答

在mac上使用grep提取特殊字符之间的字符串

我试图检索{{和| translate之间的文本。输入：TESTFILE.TXT views/range.html: <button type="button" class="btn" ng-click="setRange(7 * 24 * 3600 * 1000)">{{ '7 days' | translate }}</button> views/widget.html: <span c

0热度

1回答

无法让jsfiddle代码在jsfiddle外工作

我在jsfiddle上找到了这段代码，它在小提琴内部工作正常。但是，当我尝试将其放入自己的HTML文件中时，我无法使其工作。我确信我留下了一些脚本标记，但我不知道该怎么做。任何投入将不胜感激。这里是小提琴：Working Fiddle 附：代码应该从URL中提取信息并填写表单。 -Thanks <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transi

0热度

1回答

R：试图读取html页面的数据和分析表，但在htmlTreeParse得到错误（）

当我执行htmlTreeParser()，我收到此错误： Error in htmlTreeParse(webpage, error = function(...) { : error in creating parser for In addition: Warning message: XML content does not seem to be XML: '' 请别人帮我调试。 libra

0热度

1回答

如何在'Ruby'的帮助下从ruby中的html标记中提取纯文本gem

我有很多标记存储在数据库表文本字段中，这个标记可能会有不同的结构。我需要从这些存储在数据库中的标记中提取纯文本，所以我决定使用Ox gem，因为它是根据测试的红宝石最快的xml解析库。当我尝试这样做，我得到象这样的错误： irb(main):026:0> Ox.parse(some_html) Ox::ParseError: invalid format, document not termi

0热度

1回答

如何在选择器中过滤`each`中的cheerio对象？

我解析使用Cheerio一个简单的网页，如果可能的follwing，我很困惑：采用这种结构的一个html： <tr class="human"> <td class="event"><a>event1</a></td> <td class="name">name1</td> <td class="surname"><a>surname1</a></td>

1热度

1回答

如何解析网站的特定字符串HTML

我发现从Stackoverflow，我可以轻松地解析网站使用Jsoup。例如，我可以编写下面的代码来解析来自维基百科网站的newsHeadlines。 Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); Elements newsHeadlines = doc.select("#mp-itn b a"); 这里是我

1热度

1回答

从Python列表中删除BeautifulSoup标记

我有以下代码，它会经历一个列表并提取要放入新列表的信息。如果找到0，则附加0。如果找到'None'，则附加0。第三种列表元素是BeautifulSoup提取的标签。我希望能够做的是，提取一些内部信息标签和它添加到newList，但是因为我有regex在标签中的信息的方式越来越工作。我的代码在这里给出： list = ['<a class="vote-description__evidenc

-1热度

1回答

使用Javascript的解析器XML数据

我有如下的xml数据，我想检索所有站名，id和流派。如何做到这一点使用JavaScript？ <somelist> <datatune base="/sbin/somelist.pls" base-m3u="/sbin/tunein-station.m3u" base-xspf="/sbin/tunein-station.xspf"/> <list name="COOLfahrenheit 9

-1热度

1回答

我如何可以提取表JSOUP

我正在写一个Android应用程序，并试图找出我应该怎么构建我的电话从该网页获得表数据：http://uk.soccerway.com/teams/scotland/saint-mirren-fc/1916/squad/ 我读过从JSOUP网站的食谱但是因为在我陷入困境之前我还没有使用过这个库。我想出了这样的事情： doc = Jsoup.connect("http://uk.soccerway.