2016-12-29 91 views
-5

我有多个HTML文件,如下所示:删除从HTML文件标签之间的一些文字

</HEAD><BODY><B> something <BR>bla bla bla 
<A HREF=http://www.exemple.com>http://exemple.com</A> - site bla 
bla bla bla (test n°15336) <BR><BR><BR><HR> 

我想让它像这样:

</HEAD><BODY><B> something <BR> <BR><BR><BR><HR> 

没有什么工作:战略经济对话的grep,awk的... 有什么建议么?

+2

阅读[问]然后[编辑]你的问题提供所有缺失的部分。 –

回答

-2

我回来了解决长期搜索 首先我需要我的解析HTML文件,所以我必须创建一个PHP代码,完成这个任务非常简单而有用的

<?php 

define('TEMPLATE', __DIR__ . DIRECTORY_SEPARATOR . 'test.html'); 
$template = file_get_contents(TEMPLATE); 
$st=''; 
$template = preg_replace('#(<\/A>).*?(<BR>)#is', $st, $template); 
$template = preg_replace('#(<BR>).*?(<BR>)#is', $st, $template); 
$file = 'output.html'; 
file_put_contents($file, $template); 
?> 

的Et瞧后发布! ! XD 感谢您的声誉,并再次感谢您的帮助。