xidel

0热度

1回答

我尝试使用XPath与xidel解析html页面。该页面有一个包含多行和多列的表我需要从第2和第5列（IP和端口）的每一行获取值，并将它们存储在类似csv的文件中。这里是我的脚本 #!/bin/bash for ((i = 2; i <= 100; i++)) do xidel http://www.vpngate.net/en/ -e '//*[@id="vg_hosts_table

0热度

1回答

如何使用xidel与自定义分隔符从文件中提取数据？

variable=data 我该如何提取data？我需要以某种方式设置variable=。正在运行xidel file.txt -e "variable="会给出错误err:XPST0003: Unexpected query end并删除=不会产生任何结果。

0热度

2回答

如何获取无效html的xpath？

我试图用xidel和最近遇到无效的HTML 我使用Firefox获得的XPath来提取HTML的XPath，但Firefox会自动添加缺少的标记这样的XPath doesent比赛我可以停止火狐，或者你能建议一种解决这个问题的方法吗？也有一些反向xpath？获取一些文本的xpath？

0热度

2回答

从聊天框中抓取链接并将它们保存为CSV格式的文件

我使用“Link Klipper”铬扩展名，使用正则表达式从我的html live cbox聊天中抓取链接，该扩展名可以保存CSV文件，但有时，它没有按预期工作。 <div class="Center" style="text-align: left"> <br> <a class="MyURL" href="http://www.mywebsite.com/mylink" targe

1热度

1回答

如何将换行符添加到Xidel输出中？

我有我的批处理文件来使用抓取链接xidel，输出HTML不包含换行符到每一个环节，从另一个 @echo off for /f "delims=" %%a in ('wmic OS Get localdatetime ^| find "."') do set dt=%%a set YYYY=%dt:~0,4% set MM=%dt:~4,2% set DD=%dt:~6,2% set HH

2热度

2回答

即使某些标签不存在，如何在xpath中始终具有相同数量的结果？

我尝试从网站抓取数据。目标是并不总是提供所有细节的网站。例如，一个配置文件有name, birthday，另一个只有name。我现在尽量把握与xidel和XPath这个标签来将工作就像一个魅力，当不会是失踪（因为某个细节是不存在的），有时一些标签所以我问了一个解决方案我可以在这里填充这些带有空白标签的便签标签，这样我就可以得到一组长度相同的数据。之后我将数据转换为csv，当标签丢失时，所有数

0热度

1回答

如何从Xidel输出

我想用XPath来改进我的Xidel输出排除类：通过删除含有“ACLASS”的台词// BODY/DIV，并保持与“MyClass的”的台词只有我可以添加换行符到Xidel输出文件吗？ <a class="AClass" href="http://www.mywebsite.com/file1" target="_blank"> File1 </a> <a class="AClass" hr

0热度

2回答

xidel如何关注分页html并提取网址？

在分批和xidel 我一个网站上测试像这样的例子分页视窗7： LINK1 LINK2 LINK3 2 3 4 5 6 7 8 9 10 Next 我找到了一个方法来获得前10个链接： xidel.exe https://www.website.es/search?q=xidel+follow+pagination^&start=0 --extract "//a/extract(@href, 'ur

0热度

2回答

如何使用XPath获取表格中的上述单元格？

我想把每个单元格的所有信息放在一行中的表格中。我需要弄清楚如何打印表格中每列的标题。 td, table { border: 2px black solid; } <table> <tr> <td>a1</td> <td>a2</td> <td>a3</td> <td>a4</td> </tr>