2016-08-15 37 views
-1

对于从各种URL提取域名有很多问题,但它们都不包括所有子域和后缀(.org,.uk,.com,。 org.uk,.whatever等)。从任意类型的URL中提取域名

例如:

http://uselesstext.moretext.DOMAIN.org.uk/

结果: DOMAIN.org.uk

这里的主要问题是,它看似不可能设计一个算法来识别的哪一部分URL是相关的部分(不使用库),因为可能有不同数量的子域和后缀。

任何想法? (最好在JavaScript中)

+5

为什么'DOMAIN.xyz.com'是这里的“域名”而不是'xyz.com'或'moretext.DOMAIN.xyz.com'? – duskwuff

+0

以及你所说的,你需要有一个关于什么被视为域名的标准,然后你建立一个基于此的算法,直到你不可能知道域名是什么 – David

+0

@duskwuff确定我改变了它... – JamesJameson2456

回答