xidel

    0热度

    1回答

    我尝试使用XPath与xidel解析html页面。 该页面有一个包含多行和多列的表 我需要从第2和第5列(IP和端口)的每一行获取值,并将它们存储在类似csv的文件中。 这里是我的脚本 #!/bin/bash for ((i = 2; i <= 100; i++)) do xidel http://www.vpngate.net/en/ -e '//*[@id="vg_hosts_table

    0热度

    1回答

    variable=data 我该如何提取data?我需要以某种方式设置variable=。正在运行xidel file.txt -e "variable="会给出错误err:XPST0003: Unexpected query end并删除=不会产生任何结果。

    0热度

    2回答

    我试图用xidel和最近遇到无效的HTML 我使用Firefox获得的XPath来提取HTML的XPath,但Firefox会自动添加缺少的标记 这样的XPath doesent比赛 我可以停止火狐,或者你能建议一种解决这个问题的方法吗? 也有一些反向xpath?获取一些文本的xpath?

    0热度

    2回答

    我使用“Link Klipper”铬扩展名,使用正则表达式从我的html live cbox聊天中抓取链接,该扩展名可以保存CSV文件,但有时,它没有按预期工作。 <div class="Center" style="text-align: left"> <br> <a class="MyURL" href="http://www.mywebsite.com/mylink" targe

    1热度

    1回答

    我有我的批处理文件来使用抓取链接xidel,输出HTML不包含换行符到每一个环节,从另一个 @echo off for /f "delims=" %%a in ('wmic OS Get localdatetime ^| find "."') do set dt=%%a set YYYY=%dt:~0,4% set MM=%dt:~4,2% set DD=%dt:~6,2% set HH

    2热度

    2回答

    我尝试从网站抓取数据。目标是并不总是提供所有细节的网站。例如,一个配置文件有name, birthday,另一个只有name。 我现在尽量把握与xidel和XPath这个标签来将工作就像一个魅力,当不会是失踪(因为某个细节是不存在的),有时一些标签 所以我问了一个解决方案我可以在这里填充这些带有空白标签的便签标签,这样我就可以得到一组长度相同的数据。 之后我将数据转换为csv,当标签丢失时,所有数

    0热度

    1回答

    我想用XPath来改进我的Xidel输出排除类:通过删除含有“ACLASS”的台词// BODY/DIV,并保持与“MyClass的”的台词只有 我可以添加换行符到Xidel输出文件吗? <a class="AClass" href="http://www.mywebsite.com/file1" target="_blank"> File1 </a> <a class="AClass" hr

    0热度

    2回答

    在分批和xidel 我一个网站上测试像这样的例子分页视窗7: LINK1 LINK2 LINK3 2 3 4 5 6 7 8 9 10 Next 我找到了一个方法来获得前10个链接: xidel.exe https://www.website.es/search?q=xidel+follow+pagination^&start=0 --extract "//a/extract(@href, 'ur

    0热度

    2回答

    我想把每个单元格的所有信息放在一行中的表格中。我需要弄清楚如何打印表格中每列的标题。 td, table { border: 2px black solid; } <table> <tr> <td>a1</td> <td>a2</td> <td>a3</td> <td>a4</td> </tr>