2009-06-26 54 views
0

Web分析器能够区分网页上的静态和动态文本吗? 比如有在网页上web解析器可以区分静态和动态文本吗?

你好“神奇四侠”

在这样的字符串“你好”是一个静态数据和“神奇四侠”是一个动态的数据(比如被填充形式数据库值)

Web解析器可以检测哪些是静态和动态内容?

+0

你能说清楚“静态和动态内容”是什么意思吗?在JavaScript中生成的内容与HTML?另外,你是什么意思的“网页解析器”?你的意思是一个爬虫? – 2009-06-26 08:44:37

回答

3

我认为这是不可能的。客户端无法知道服务器中执行代码的任何内容,因此无法知道文本是否由PHP,ASP或任何其他语言生成,或者甚至是静态的。

0

如果文件是静态(直接从文件系统)提供或生成的,您可以查看URL和HTTP标头以进行有根据的猜测。但是,大多数“网页解析器”都不会获得这些信息,而且几乎所有生成的页面都有静态位。 (有时这些都直接包含在源代码中,或者可能来自模板或SSI文件。)区分这些静态位和其他位是不可能的。