2009-10-30 114 views
-1

如何通过PHP获取网站信息。如何通过PHP获取网站信息

不使用

file_get_contents

是否有任何其他方式来获取网站信息。

例如网址:http://www.quarkbase.com/google.com

在这个页面中,您将获得有关GOOGLE页面全部信息。像这样如果我输入任何一个网站的URL,我需要获得有关该网站的更多信息。

我希望查询非常清楚。

让我知道如果您有任何关于查询

任何疑问

由于N使

FERO

回答

0

cURL不会解决他的问题。它可以帮助他截取网站的截图,但是他们关于URL的信息来自大量来源。交通信息来自Alexa,他们从相关网站获取社交网络统计信息,以及有关运行网站的公司的任何信息,他们可以从单独的数据库中获得,也可以让员工输入有关他们索引的较大网站的信息。

简单地通过阅读页面的来源,没有办法辨别那种类型的信息。他们使用大量的算法搜索页面内容的模式,他们使用Alexa的API来获取其使用数据,他们使用社交网络服务的API来从他们的数据中挖掘数据等。

这绝对不是一件容易的事情...

+0

Hi Braeden,你会指导我解决这个问题。因为我是初学者,所以我需要一些专家帮助...你会吗? – Fero 2009-10-30 05:13:14

0

因此,通过网站信息的等级?是指注册机构和域信息?就像通过dnsstuff.com或其他有关拥有该域名的公司的元信息一样。

自动抓取这些类型的数据可能会非常棘手。您不仅需要从几个地方获取这些信息,但是如果他们发现您不遵守robots.txt,那么许多地方会阻止您。

您需要更精确地列出要收集的内容。谷歌的“dns工具”,你会发现像http://dnsstuff.com这将导致你更接近获取这些信息。有时你必须去像networksolutins.com这样的注册商才能获取信息。另外,请查看unix whois命令和unix dig命令。

+0

嗨memnoch_procy ..我不需要file_get_contents()。因为它没有做我想做的事......我也需要这些注册商和域信息。是可以做到的吗?我在那里举了一个例子网站。我只需要网站描述,徽标和注册商以及域名信息。请帮我解决这个问题 – Fero 2009-10-30 05:10:19

1

您可能要检查出的F *()函数从C

它们允许细流操作移植。

一些很好的提示here

$handle = fopen("http://www.quarkbase.com/google.com/", "r", false, $context); 
$text = ''; 
while (!feof($handle)) 
    $text .= fread($handle, 8192); 
fclose($handle);