2012-03-26 52 views
0

我想采取html片段并将其传递给pygmentize以相应地着色。我想知道如何使用sed或其他cli工具来实现这一目标。sed multiline pygmentize

我尝试了一堆的sed单行的,并试图使用以下SO问题:

我有以下的日志:

2012-03-26 18:04:27,385 9372 [main] ERROR web.commons.exception.ServiceInvocationException - 
Response from server cannot be decoded to JSON, responsePayload = <html> 
<head> 
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1"/> 
<title>Error 404 Not Found</title> 
</head> 
<body><h2>HTTP ERROR 404</h2> 
<p>Problem accessing jetty-url. Reason: 
<pre> Not Found</pre></p><hr /><i><small>Powered by Jetty://</small></i><br/> 
<br/> 
<br/> 
<br/> 
<br/> 
<br/> 
<br/> 
<br/> 
<br/> 
<br/> 
<br/> 
<br/> 
<br/> 
<br/> 
<br/> 
<br/> 
<br/> 
<br/> 
<br/> 
<br/> 

</body> 
</html> 

org.codehaus.jackson.JsonParseException: Unexpected character ('<' (code 60)): expected a valid value (number, String, array, object, 'true', 'false' or 'null') 
at [Source: [email protected]; line: 1, column: 2] 

UPDATE我加入这一个较长的命令:

mvn -U test | (while read line; do echo ${line} | sed -e "s/.*ERROR.*/`echo -e '\e[91m&\e[0m'`/g" -e "s/.*\(WARN|INFO\).*/`echo -e '\e[93m&\e[0m'`/g"; done) 

回答

0

我用它作为更长命令的一部分:

mvn -U test | (while read line; do echo ${line} | sed -e "s/.*ERROR.*/`echo -e '\e[91m&\e[0m'`/g" -e "s/.*\(WARN|INFO\).*/`echo -e '\e[93m&\e[0m'`/g"; done) 
2

猫日志| AWK '/ <HTML> /,/ <\/HTML> /'

应该这样做。

要删除第一个html标记之前的“废话”,请将sed将html标记放在它自己的行上。

cat log | sed's/<html>/\ n <html> /'| AWK '/ <HTML> /,/ <\/HTML> /'

+0

你需要在END模式中跳过'/'。另外,考虑到用户的样本输入,我认为你的解决方案将包括看起来在同一行上的开头''前面的非html文本。祝你们好运。 – shellter 2012-03-26 22:52:55

+0

嗯。这很奇怪。在预览中显示逃生。在最后的答案,它不是! – John3136 2012-03-26 22:56:17

+0

嘿,这很酷,但仍然有第一行的输入,它将成为一个更长的命令的一部分。尽管你的回答仍然非常有帮助,但这可能有点过分。如果它太多,我可能会创建一个python程序来提供一些帮助。 – prafulfillment 2012-03-26 23:09:17

0

TXR:

为了便于说明,我们以替换在HTML的每一个字母X.与

一个命令替换 pygmentize
@;; replace with .e.g. pygmentize 
@(bind filter "tr [A-Za-z] X") 
@date @time @pid [@function] @error_1 
@error_2 <html> 
@(collect) 
@stuff 
@(last) 
</html> 
@(end) 

@error_3 
@(output) 
@date @time @pid [@function] @error_1 
@error_2 
@(end) 
@(output `[email protected]`) 
<html> 
@{stuff "\n"} 
</html> 
@(end) 
@(output) 
@error_3 
@(end) 

试运行:

$ txr log.txr log.txt 
2012-03-26 18:04:27,385 9372 [main] ERROR web.commons.exception.ServiceInvocationException - 
Response from server cannot be decoded to JSON, responsePayload = 
<XXXX> 
<XXXX> 
<XXXX XXXX-XXXXX="XXXXXXX-XXXX" XXXXXXX="XXXX/XXXX; XXXXXXX=XXX-8859-1"/> 
<XXXXX>XXXXX 404 XXX XXXXX</XXXXX> 
</XXXX> 
<XXXX><X2>XXXX XXXXX 404</X2> 
<X>XXXXXXX XXXXXXXXX XXXXX-XXX. XXXXXX: 
<XXX> XXX XXXXX</XXX></X><XX /><X><XXXXX>XXXXXXX XX XXXXX://</XXXXX></X><XX/> 
<XX/> 
<XX/> 
<XX/> 
<XX/> 
<XX/> 
<XX/> 
<XX/> 
<XX/> 
<XX/> 
<XX/> 
<XX/> 
<XX/> 
<XX/> 
<XX/> 
<XX/> 
<XX/> 
<XX/> 
<XX/> 
<XX/> 

</XXXX> 
</XXXX> 
org.codehaus.jackson.JsonParseException: Unexpected character ('<' (code 60)): expected a valid value (number, String, array, object, 'true', 'false' or 'null')