2012-07-16 75 views
-2

我想从网站列表中提取域和路径。例如,如果网站是http://www.domain.com/path1/page1.html我想获得http://www.domain.com/path1/,如果网站是http://www.domain2.com/path2/page2/我想获得http://www.domain2.com/path2/从网站提取域和路径

我试着下载页面并检索所有锚点,但我只能得到文件的相对路径(在本例中为/page1.html和/ page2 /)。有没有办法让我达到我想要的?

+0

您使用什么编程语言来解析的网址? – 2012-07-16 20:16:14

+0

我猜C#,因为所有的OP的其他问题都是针对C#的。 – Blender 2012-07-16 20:19:25

+0

是的我在C#中编程 – user1295450 2012-07-16 20:23:32

回答

0

path2并不总是存在于所有的URL中。所以你不会得到一个现成的方法来解析。 我建议写为 功能非常粗略,给你一个想法:

var index = url.IndexOf(".com/"); 
var substringAfterFirstSlash = url.SubString(index, url.Length + 1 - index) 
var indexOfSecondSlash = substringAfterFirstSlash.IndexOf("/") + index; 
var yourPath = url.SubString(0, indexOfSecondSlash+1);