2012-01-30 110 views
1

我试图使用grep获取HTML文件中jpg图像的完整url地址。一个问题是,其中没有很多新行,所以当我使用grep时,它会得到路径,但也有很多我不感兴趣的其他东西。我怎样才能获得jpg图像的url?从HTML文件获取jpg图像

+0

你能提供你的HTML的例子和当前'grep'命令? – olibre 2012-01-30 07:51:10

回答

10

一个单一sed命令

sed -n '/<img/s/.*src="\([^"]*\)".*/\1/p' yourfile.html 

一个单一grep命令

grep -o '<img[ ]*src="[^"]*"' yourfile.html 

两个连续grep命令

grep -o '<img[ ]*src="[^"]*"' yourfile.html | grep -o '"[^"]*"' 

从网络提议s-hunter

curl www.example.com/page.html | sed -n '/<img/s/.*src="([^"]*)".*/\1/p' 
+1

哇,令人印象深刻!需要多长时间才能拿出所有这些?你是从记忆中做到这一点的,还是你不得不查找的东西? – 2012-01-30 08:43:51

+0

我从记忆中做了。几分钟后,我想知道这是否正确。然后,我在我的电脑上测试过,看到'sed'命令是正确的。但是,我没有测试过'grep' ...应该对于一些不起眼的JavaScript代码来说是一样的,不是吗? – olibre 2012-01-30 09:16:27

+1

第一条命令是我所需要的。其他人稍微偏离。不过,我留下了深刻的印象。您需要多长时间才能熟练使用sed?我们可以成为Facebook的朋友吗? – 2012-01-30 09:19:05