我可以收集智能数据,HTML使用python刮?我不知道它,所以我想想一些想法。是否可以通过Python进行HTML抓取,数据挖掘?
回答
看着模块scrapy:
尝试使用的urllib2和美味的汤。
的urllib2是请求的URL编程有用的。这是标准库的一部分:http://docs.python.org/library/urllib2
美丽的汤是很好的挖掘HTML/XML,并可以在这里找到:http://pypi.python.org/pypi/BeautifulSoup
的链接都死了。 – 2016-05-12 09:01:53
@TilakMadichetti不,他们不是。 – SmallChess 2016-11-01 02:24:12
抱歉!那时候我的网络出现了问题。我的错 :) – 2016-11-05 10:16:52
您也可以使用htql库在:http://htql.net。
- 1. 使用Python进行数据挖掘
- 2. python数据挖掘
- 3. 数据挖掘SSE通过集群K
- 4. 使用Python进行文本挖掘
- 5. 递归挖掘后没有数据抓取
- 6. 数据挖掘库和许可限制
- 7. 数据挖掘字符串
- 8. 数据挖掘情况
- 9. 数据挖掘教科书
- 10. “相似性”数据挖掘
- 11. R数据挖掘语法
- 12. Google数据挖掘工具
- 13. 是否可以从FaceBook中挖掘校友信息
- 14. 什么是数据挖掘模型?
- 15. 读取HTML代码为R的数据和文本挖掘
- 16. 使用PHP进行文本挖掘
- 17. 可以禁用日志以防止进程挖掘
- 18. 使用python进行网页抓取以提取数据
- 19. 使用大量小数据集进行关联挖掘
- 20. 学校项目的AWS如何进行数据挖掘?
- 21. 数据挖掘海量数据
- 22. 是否可以使用cURL通过SSH抓取文件?
- 23. 是否在HyperLedger中挖掘块?
- 24. 是否可以通过以下函数进行列表理解?
- 25. 通过SQL Analysis Services挖掘模型检查/挖掘的前端应用程序
- 26. 是否可以通过subprocess.Popen与子子进程进行通信?
- 27. 是否可以通过串行bt桥与iPhone进行通信?
- 28. 是否可以通过XBAP覆盖HTML?
- 29. 用于网页抓取或网页挖掘的Java API
- 30. 从数据中获取信息 - 数据挖掘实用技术
[Python和数据挖掘]的可能重复(http://stackoverflow.com/questions/1321749/python-and-data-mining) – 2011-05-23 00:04:36