我已经设法从网站提取数据,然后从提取的网页中获取相关数据。现在我坚持如何从<td>
cols中提取数据。进入数据操作的数组?如何使用bash将数据从列中提取到数组中?
我提取HTML是以下几点:
<tbody>
<tr>
<td>abc3207</td>
<td>151</td>
<td>Lorem Ipsum</td>
<td>Off Campus</td>
<td>OFF</td>
<td>12 of 999 </td>
<td> </td>
<td> </td>
<td><a href="http://lorem.com/test?id=abc3207&year=2015" target="_blank">Get</a></td>
</tr>
<tr>
<td>abc3207</td>
<td>151</td>
<td>Dolor Sit Amet</td>
<td>Mount Lawley</td>
<td>ON</td>
<td>45 of 999 </td>
<td><a href="http://lorem.com//lookup?sq_content_src=asas">Activity</a></td>
<td> </td>
<td><a href="http://lorem.com/test?id=abc3207&year=2015" target="_blank">Get</a></td>
</tr>
</tbody>
我使用的是bash脚本,因为我必须通过庆典只能做它这样做。
你认为在你的脚本中使用正则表达式? – 2016-04-03 06:24:05
“仅限bash”意味着你已经将自己限制在了错误的工具上。 –