2014-10-05 83 views
0

提取信息,我想FS是< ......>在awk如何从HTML标签

点是任何东西。所以,如果我已经让我们说

<td width="50%" valign="top">System Hardware</td>

我想提取System Hardware。我已经尝试了两件事,但它不起作用。

  1. awk -F "\<([^>]+)\>" '{print $1}' test.txt
  2. awk -F "\<?*\>" '{print $1}' test.txt

在这两种情况下,我什么也没得到

回答

2

你得到什么,因为你告诉awk将打印$ 1,它是该领域的第一个前场分隔器。你想要print $2

$ awk -F'<[^>]+>' '{print $2}' file 
System Hardware