我正在编写一个程序,它可以获取带有视频的网页的源代码。然后它使用正则表达式来隔离该视频的下载链接。那么它使用httpwebrequest
和httpwebresponse
下载视频。我的问题出现在某些网站有一个页面,您必须点击“继续”才能访问视频页面。如何使用VB.net获取html页面的源代码?
例如,有玩http://nextgenvidz.com/view/s995xvc9e2fv视频名为“The.Matrix.Reloaded.2003.mp4”所以我告诉我的程序,以获取链接“http://nextgenvidz.com/view/s995xvc9e2fv”的源代码,但它无法找到视频的下载链接,因为它在“继续”页面的源代码中搜索文件。如果您转到上面的网站并查看源代码,则不会看到链接。然后,点击继续,当视频出现时执行相同操作,您会注意到该文件仅存在于第二个文件中。
如何获取播放视频的页面的源代码,而不是必须单击的页面继续?
我想使用此代码:
Private Sub Button1_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button1.Click
Dim Loading As String = "Loading..."
TextBox1.Text = Loading
Dim request As System.Net.HttpWebRequest = System.Net.HttpWebRequest.Create(TextBox2.Text)
Dim response As System.Net.HttpWebResponse = request.GetResponse()
Dim sr As System.IO.StreamReader = New System.IO.StreamReader(response.GetResponseStream())
Dim sourcecode As String = sr.ReadToEnd()
TextBox1.Text = sourcecode
End Sub
也许有一种方法可以自动选择“继续”按钮编程?
我怀疑按钮有一些客户端的JavaScript,你将需要interperet。几乎好像作者不希望你这样做。 – Jodrell 2011-04-28 12:16:56
以及我怎么会得到实际上有它的视频页面,而不是继续页面的HTML源代码? – daniel11 2011-04-28 12:32:13
当你点击它时,你必须做按钮的操作,但是这可能会被服务器端元素混淆。我无法提供一个通用答案,我不想点击您当前位置的链接。 – Jodrell 2011-04-28 12:44:37