我需要做的是检索通过一个命令,比如链接:用sed和wget检索链接仅
wget --quiet -O - linkname
然后通过管道它的sed只是仅显示在页面上的链接不格式。
我到目前为止只显示所有html代码的一行。
我需要做的是检索通过一个命令,比如链接:用sed和wget检索链接仅
wget --quiet -O - linkname
然后通过管道它的sed只是仅显示在页面上的链接不格式。
我到目前为止只显示所有html代码的一行。
我相信这是我一直在寻找。
sed -n "/href/ s/.*href=['\"]\([^'\"]*\)['\"].*/\1/gp"
可以通过管道将结果grep
与-o
(比赛只)选项:
$ wget --quiet -O - http://stackoverflow.com | grep -o 'http://[^"]*'
进去href="..."
所有网址:
grep -oP '(?<=href=")[^"]*(?=")'
我正在寻找更多使用sed的方法。我需要学习它。我得到的是这个...但我想要一个全部的sed命令 - wget --quiet -O - link | grep -o' leeman24 2012-03-30 03:59:46
在MacOS和其他BSD发行版中:'ggrep -oP'而不是'grep -oP'。GNU'grep' 。需要安装。 – 2017-08-14 08:08:07
grep "<a href=" sourcepage.html
|sed "s/<a href/\\n<a href/g"
|sed 's/\"/\"><\/a>\n/2'
|grep href
|sort |uniq
你能显示你为最后2行写的代码吗?你的预期输出是什么?展示样本 – 2012-03-28 01:12:04
您可能还想查看[网页抓取](http://en.wikipedia.org/wiki/Web_scraping)工具。 – 2012-03-28 01:51:52