2016-01-24 99 views
0

是否有一个文本编辑器,软件,脚本,代码,狙击手或类似的东西生成输出类似于图片上的一个HTML文件? 在其他作品中只能输出html标记标签。 谢谢你帮助我。 output sample Before and After如何提取html标记标记

这里是什么,我需要这样你们可以理解我正在寻找一个之前和之后的图像。我不太擅长细节。谢谢

+0

我不知道一个,但你可以做的是解析文本,并用空格('“”'')替换引号('“something”')之间找到的任何东西。 – GAntoine

+0

谢谢,但实际上我不需要用引号替换任何内容,我需要的是摆脱标签<>之间的所有内容。 –

+0

那么你链接的输出样本是不正确的? – GAntoine

回答

0

我不知道这个任务的工具。我认为研究像这样的html文件的结构是一个有趣的想法。我需要这几次一样,所以我写了一个小的命令行工具,是应该做的工作:

html_skeletonhttps://github.com/antonharald/html_skeleton


作用:

  1. 读取文件
  2. 将HTML结构解析为虚拟DOM
  3. 递归访问所有HTML元素。对于他们每个人:删除属性值,并在没有孩子的情况下:删除它的文本内容。
  4. 将操作的DOM转换为HTML代码并打印出来。

我没有时间去测试它,所以很高兴听到它是否适用于您。

+0

谢谢安东。是的,它为我工作。这是一个很棒的工具,如果可以作为书签附加到浏览器来处理远程文件,而不是在localhost中存在文件,则它可能更好。感谢您分享此工具。 –