我需要构建一个系统以从网页集合中提取海量数据。很多这些网站(mayabe 90%左右)由各种不同的JavaScript系统提供支持。我想知道什么是最有效的方法来提取这些数据?从javascript网页中提取数据
由于每个站点都不同,我正在寻找一个灵活的解决方案,并且由于有许多站点,我正在寻找一种解决方案,尽可能减轻网络压力。
我的大部分编程经验都是使用C,C++和Perl编写的,但是我很乐意提供最好的结果。
网页不断更新我希望提取的数据和统计信息,并对其进行一些分析,因此我需要能够轻松地将它们存储在数据库中。
我已经做了一些我自己的研究,但我真的在这里空白。我希望别人能帮助我! :)
'刮'是非常不道德的。你想做什么? – Halcyon 2011-04-25 09:49:07
一些关于博彩公司赔率变化的统计分析。 – dlmalloc 2011-04-25 10:04:17
您可能可以编写一些正则表达式来提取数据部分。真的没有多少。 – Halcyon 2011-04-25 10:10:02