2013-05-17 75 views

回答

3

它可能......但合法性是另一个问题。

如果搜索引擎使用GET的“另一个”网页,那么它的简单(当然,使用POST也可以)。只需创建URL,在您的应用程序中加载它的内容,然后为生成的HTML编写解析器。有很大的可能性,结果将以稳定的方式形成(表格,divitis),所以它更容易。只需为结果HTML(或其他类型)编写简单的正则表达式并从中获取结果。

从搜索结果中挖掘这个“强力”数据的问题是,如果他们改变了他们的页面,那么你的应用程序就会“下地狱”。在我的应用程序中,我解决了使用extarnal配置文件,包括只更改搜索查询和外部正则表达式的URL。

例子:

URL: http://www.example.com/search.php?query=[SEARCHED_DATA] 

文本[SEARCHED_DATA]是应用程序与whateever你正在寻找替代之内。

如果更改了页面,则可以轻松地进行应用程序更新而无需重新构建应用程序。

一些页面提供搜索API,这是更好的方法。但是从我的问题来看,我认为事实并非如此。

+0

OP确实询问过“是否有可能......” –

+1

请在阅读本文之前,请仔细阅读您尝试搜索的网站的条款和条件。大多数网站明确禁止这样做。 –

+0

这是一个代码测试,我的意思是,我参加了一个课程,要求我做一个技术测试。谢谢 – diminuta

3

最好的办法是尝试与提供某种API访问其数据的网站集成。试图从第三方网站抓取HTML会引起麻烦。

+3

法律和技术。 –

+2

如果法律问题得到解决,您仍然可以随时更改其网站或布局或网址格式,而不会有任何警告。这会破坏你的网站。 –

+0

@LeeMeador,我不建议在屏幕上刮屏幕...实际上我是在推荐它。 –

相关问题