从任意类型的URL中提取域名

-1

对于从各种URL提取域名有很多问题，但它们都不包括所有子域和后缀（.org，.uk，.com，。 org.uk，.whatever等）。从任意类型的URL中提取域名

例如：

http://uselesstext.moretext.DOMAIN.org.uk/

结果： DOMAIN.org.uk

这里的主要问题是，它看似不可能设计一个算法来识别的哪一部分URL是相关的部分（不使用库），因为可能有不同数量的子域和后缀。

任何想法？（最好在JavaScript中）

为什么'DOMAIN.xyz.com'是这里的“域名”而不是'xyz.com'或'moretext.DOMAIN.xyz.com'？ – duskwuff

以及你所说的，你需要有一个关于什么被视为域名的标准，然后你建立一个基于此的算法，直到你不可能知道域名是什么 – David

@duskwuff确定我改变了它... – JamesJameson2456

你在这里找的是Public Suffix List。它是每个可以独立管理域名的域名扩展名列表（例如，com,org.uk等）。

此列表中有许多Javascript实现可用。最常见的两种是publicsuffixlist.js和tld.js。

2016-08-15 19:19:10 duskwuff

回答