我只想获取相册名称。下面是一个例子页:提取picasa网络相册名称
http://picasaweb.google.com/sunnchoi
但是,当我wget的它和grep为标题的模式,我得到100个结果。我知道我必须模拟点击“显示更多相册”链接。我该怎么做(使用bash utils/perl)?
我只想获取相册名称。下面是一个例子页:提取picasa网络相册名称
http://picasaweb.google.com/sunnchoi
但是,当我wget的它和grep为标题的模式,我得到100个结果。我知道我必须模拟点击“显示更多相册”链接。我该怎么做(使用bash utils/perl)?
他们有Python/Java和其他语言的例子。这里的request a list of albums(这个使用python)。
如果您xmlstarlet可用,您可以直接解析给定网站的相应RSS网址:
xmlstarlet sel --net -T -t -m '//item' -v 'title' -n \
'http://picasaweb.google.com/data/feed/base/user/sunnchoi?alt=rss&kind=album&hl=en_US&access=public' |
nl