我有一个site我想用Unix下载wget
下载。 如果您查看文件的源代码和内容,它包含一个名为SUMMARY的部分。 然而发出这样的wget命令后:如何启用'wget'用Javascript下载HTML的全部内容
wget -O downdloadedtext.txt http://www.ncbi.nlm.nih.gov/IEB/Research/Acembly/av.cgi?db=mouse&c=gene&a=fiche&l=2610008E11Rik
的downdloadedtext.txt
的含量是不完全的和不同的源代码该站点的 。例如它不包含SUMMARY部分。是否有正确的方式来正确获取完整的内容?
我问这个问题的原因是因为我想从该HTML中的不同值自动下载。
我不明白。源代码有什么不同? Javascript与它有什么关系? – 2010-04-14 09:37:23
@Pekka:包含javascript的正文没有被下载。请尝试看看。 – neversaint 2010-04-14 09:40:10
我现在没有wget(在Windows机器上)。实际的* body *不同或者js文件没有被下载? – 2010-04-14 09:41:47