html-parsing

    0热度

    1回答

    我在nodejs中使用htmlparser2来解析HTML页面。我解析一个页面以获取到其他页面的链接。然后,我想解析这些链接(解析函数与第一个解析页面上的解析函数不同)以获取我需要的链接旁边的其他信息。 我的问题是,我不知道如何解析多个页面。如果我在数组中放入链接,然后遍历它并为每个页面调用解析器,由于异步性质,它不起作用。即使我在for循环中调用了多个请求,它也不会解析所有的链接,而且我仍然遇到

    0热度

    1回答

    我同时使用html-to-react解析器ReactJS 我得到一个错误 “_htmlToReact.HtmlToReactParser不是构造函数”得到错误。 我已导入'HtmlToReactParser'作为 import {HtmlToReactParser} from 'html-to-react'

    0热度

    1回答

    我想解析一个html,里面有几个li元素。这只是我用两个div保存的示例html。我有将近7000个div来解析。并非所有的div都具有其中的所有li元素。例如, <li class="brewery_type">可能不适用于所有div。由于这个代码将不能够将所有的值填充到tibble中。在那种情况下,我仍然可以通过这个解析并用NA来替换该div中缺少的li元素。 library(rvest)

    0热度

    1回答

    当我们在https://www.worldcat.org/上搜索一本书时,它会给出所有相关版本(查看所有版本),现在我想收集每本书的相关版本及其所有信息。下面代码的输入是一个csv文件,其中包含一些书籍的ISBN,输出是一个包含收集信息的csv文件。 import csv import sys from bs4 import BeautifulSoup import datetime im

    1热度

    1回答

    我需要检索没有给定文本的孩子的div。我有此HTML <h1>Rest Object</h1> <div style="background-color: transparent;"> <div>Title: Rest object</div> <div>ID: 2</div> <div>Title: Rest object Copy</div> <div

    1热度

    1回答

    逗人, 我需要收集的数据在下面的HTML字符串 parser.feed(<table><tr><td><a href="http://rads.stackoverflow.com/amzn/click/B00JX1ZS5O" target="_blank"><img src="https://images-na.ssl-images-amazon.com/images/I/41B39oDSGQL.

    0热度

    2回答

    获取文本我有以下的html代码: <body class="frontend page-object" data-tealium="{"tmsData":{"ad_type":"Marktplatz","page_type":"Ad_View","vertical_id":"5","vertical":"Marktplatz","ad_title":"LEGO+Technic+8045+-+Min

    0热度

    1回答

    我有一些HTML文件问题被结构是这样的: <p> ... <p> 显然谁写这个做了一个语法错误和实际意思是这样写: <p> ... </p> 有人告诉我,HTML Agility Pack会自动修复此问题,但似乎并非如此。我也尝试添加 HtmlNode.ElementsFlags["p"] = HtmlElementFlag.Closed; 但只是给我的结果:

    2热度

    1回答

    我有这样一个变量: $content = ' <i class="fa fa-hashtag" aria-hidden="true"> <a href="http://example.com/tag/digital_marketing">digital marketing</a> </i> <i class="fa fa-hashtag" aria-hidden="true">

    1热度

    1回答

    我遇到了开发我的Codename One应用程序的路障。我的项目中的一个类从网站分析3个特定的html“td”元素,并将文本保存为字符串,然后将该文本数据输入到Codename One多按钮中。我最初使用jSoup进行这个操作,但很快就意识到Codename One不支持第三方jar文件,所以我使用了如下所示的方法。 public void showOilPrice() { if (cu