嗯,我非常想弄清楚如何从网页中提取信息,并将其带入我的程序(Java)。 例如,如果我知道我想从中获取信息的确切页面,为了简化百思买项目页面,我将如何从该页面获取我需要的相应信息?像标题,价格,描述一样? 这个过程甚至会被称为什么?我不知道甚至开始研究这个。 编辑: 好吧,我跑了JSoup测试(一张贴BalusC),但我不断收到此错误: Exception in thread "main" jav
任何人都有一个很好的解决方案,用JavaScript生成的内容(在这种情况下,HTML表格)抓取页面的HTML源代码? 令人尴尬简单,但可行的解决方案使用Crowbar: <?php
function get_html($url) // $url must be urlencode(d)
{
$context = stream_context_create(array(
'http'