html-parsing

    2热度

    1回答

    摇运行验证,并得到了一些错误。 f<!DOCTYPE html>↩ <!--[if IE 8 ]><html class="ie ie8 no-js" lang="en-US" prefix="og: http://ogp.me/ns#"> <![endif]-->↩ <!--[if (gte IE 9)|!(IE)]><!--><html class="no-js" lang

    -1热度

    2回答

    我试图检索{{和| translate之间的文本。 输入:TESTFILE.TXT views/range.html: <button type="button" class="btn" ng-click="setRange(7 * 24 * 3600 * 1000)">{{ '7 days' | translate }}</button> views/widget.html: <span c

    0热度

    1回答

    我在jsfiddle上找到了这段代码,它在小提琴内部工作正常。但是,当我尝试将其放入自己的HTML文件中时,我无法使其工作。我确信我留下了一些脚本标记,但我不知道该怎么做。任何投入将不胜感激。 这里是小提琴:Working Fiddle 附:代码应该从URL中提取信息并填写表单。 -Thanks <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transi

    0热度

    1回答

    当我执行htmlTreeParser(),我收到此错误: Error in htmlTreeParse(webpage, error = function(...) { : error in creating parser for In addition: Warning message: XML content does not seem to be XML: '' 请别人帮我调试。 libra

    0热度

    1回答

    我有很多标记存储在数据库表文本字段中,这个标记可能会有不同的结构。 我需要从这些存储在数据库中的标记中提取纯文本,所以我决定使用Ox gem,因为它是根据测试的红宝石最快的xml解析库。当我尝试这样做,我得到象这样的错误: irb(main):026:0> Ox.parse(some_html) Ox::ParseError: invalid format, document not termi

    0热度

    1回答

    我解析使用Cheerio一个简单的网页,如果可能的follwing,我很困惑: 采用这种结构的一个html: <tr class="human"> <td class="event"><a>event1</a></td> <td class="name">name1</td> <td class="surname"><a>surname1</a></td>

    1热度

    1回答

    我发现从Stackoverflow,我可以轻松地解析网站使用Jsoup。 例如,我可以编写下面的代码来解析来自维基百科网站的newsHeadlines。 Document doc = Jsoup.connect("http://en.wikipedia.org/").get(); Elements newsHeadlines = doc.select("#mp-itn b a"); 这里是我

    1热度

    1回答

    我有以下代码,它会经历一个列表并提取要放入新列表的信息。 如果找到0,则附加0。如果找到'None',则附加0。 第三种列表元素是BeautifulSoup提取的标签。 我希望能够做的是,提取一些内部信息标签和它添加到newList,但是因为我有regex在标签中的信息的方式越来越工作。 我的代码在这里给出: list = ['<a class="vote-description__evidenc

    -1热度

    1回答

    我有如下的xml数据,我想检索所有站名,id和流派。如何做到这一点使用JavaScript? <somelist> <datatune base="/sbin/somelist.pls" base-m3u="/sbin/tunein-station.m3u" base-xspf="/sbin/tunein-station.xspf"/> <list name="COOLfahrenheit 9

    -1热度

    1回答

    我正在写一个Android应用程序,并试图找出我应该怎么构建我的电话从该网页获得表数据:http://uk.soccerway.com/teams/scotland/saint-mirren-fc/1916/squad/ 我读过从JSOUP网站的食谱但是因为在我陷入困境之前我还没有使用过这个库。我想出了这样的事情: doc = Jsoup.connect("http://uk.soccerway.