我很喜欢用java编程语言,我喜欢从网站中提取数据并将其存储到我的机器上运行的数据库中。在java.If中可能会出现这种情况,因此我应该使用哪个API。例如,网站上列出的学校数量如何提取数据并使用java将其存储到我的数据库。如何从使用java的网站提取数据?
6
A
回答
7
0
根据您真正想要做的事情,您可以使用许多不同的解决方案。
如果您想要获取网页的HTML代码,那么URL.getContent()可能是您的解决方案。这里是一个小教程:
http://www.javacoffeebreak.com/books/extracts/javanotesv3/c10/s4.html
编辑:听不懂他在寻找一种方式来解析HTML代码。上面提出了一些工具。对不起。
1
你绝对需要一个像NekoHTML这样的好解析器。
下面是使用NekoHTML,尽管使用Groovy(一个基于Java的脚本语言)的例子,而不是Java本身:
http://www.keplarllp.com/blog/2010/01/better-competitive-intelligence-through-scraping-with-groovy
1
您可以使用VietSpider XML从
http://sourceforge.net/projects/binhgiang/files/
下载VietSpider3_16_XML_Windows.zip或VietSpider3_16_XML_Linux.zip
VietSpider Web数据提取器:软件从网站((Data Scraper))抓取数据,格式为XML标准(Text,CDATA),然后存储在关系数据库中。产品支持各种RDBM,如Oracle,MySQL,SQL Server,H2,HSQL,Apache Derby,Postgres ... VietSpider Crawler支持会话(登录,通过表单查询),多重下载,JavaScript处理,代理(和多代理通过自动扫描代理网站)...
相关问题
- 1. 使用iMacros从网站提取数据
- 2. 使用python从网站提取数据
- 3. 使用Python从网站提取数据
- 4. 如何从使用Java的网站中提取受登录保护的数据?
- 5. 如何使用Excel VBA从网站中提取数据
- 6. 使用PHP卷曲从多个网站提取数据提交
- 7. 从网站提取数据表
- 8. 从Google Play网站提取数据
- 9. 从网站提取元数据
- 10. 从Google App Engine网站提取数据
- 11. 从使用PHP的网站提取数据
- 12. 如何从使用php的网站上的日历提取数据?
- 13. 如何从vbscript中的供应商网站提取数据?
- 14. 使用C#从网站读取数据
- 15. 使用Jsoup从网站读取数据
- 16. 使用PHP从网站刮取数据
- 17. 如何从第三方网站提取数据,例如价格?
- 18. 如何从网站获取DOM数据
- 19. 如何从https网站取消数据
- 20. 如何从本网站刮取数据?
- 21. 如何从网站上抓取数据
- 22. 使用JavaScript从网站(spotify)提取数据
- 23. 无法使用urllib2从网站中提取数据
- 24. 使用PHP延迟时间后从网站提取数据
- 25. 提取从网站使用VBA
- 26. 从网站使用rvest提取表格
- 27. Android - 如何从FTP网站提取HTML
- 28. 如何使用C#从网站中提取确切的信息?
- 29. 如何从使用JSoup的网站中提取段落?
- 30. 如何使用py-requets从网站获取数据?
Dupes:http://stackoverflow.com/questions/tagged/screen-scraping+java – Jherico 2010-01-11 19:43:05
数百万的愚蠢! http://stackoverflow.com/questions/26638/what-html-parsing-libraries-do-you-recommend-in-java,http://stackoverflow.com/questions/238036/java-html-parsing等,等 – 2010-01-11 21:34:26