2017-07-28 126 views
-3

使用NodeJS我想解析声明的JSON和JS变量,这是第三方网站的HTML。从HTML提取JSON变量并输出它的最简单方法是什么?从HTML解析JSON

HTML大块从中我想提取提到JS可以波纹管可以看出:

... 
 
<footer> 
 
    <div> 
 
    <script type="application/ld+json"> 
 
      {"@context":"http:\/\/schema.org","@type":"BreadcrumbList","itemListElement":[{"@type":"ListItem","position":1,"item":{"@id":"https:\/\/www.domain.com\/","image":"https:\/\/assets.domain.com\/img\/facebook\/stuf.png","name":"Home"}}]} 
 
    </script> 
 
    <script> 
 
     var API_URL = ["https:\/\/api1.domain.com\/api","https:\/\/api2.domain.com\/api","https:\/\/api3.domain.com\/api"], 
 
    </script> 
 
    </div> 
 
</footer> 
 
...

以下HTML是从XY网站使用要求的NodeJS解析。

我试着用JSDOM,但我不知道如何选择提到的<script>。正则表达式是唯一的解决方案?

+0

这是绝对不清楚你在问什么。请提供一些最低限度的例子。 – Lazyexpert

+0

我希望这有助于。 – Sigismund

回答

0

如果您提供,选择器将是:footer>div>script:nth-child(2)。 这是你要求的吗?

+0

我想我可以在星期五责怪它,甚至没有考虑脚本是DOM ... ty的一部分 – Sigismund