我正在研究这个项目,它要求我对从网页获得的文本进行一些文本处理。 现在,实现这一目标的第一步就是找到一个解析器,该解析器将提取所需的正文文本,而忽略冗余信息。我不知道我会怎么做,因为我对编程非常陌生。我真的很感谢任何帮助,我可以得到。 在此先感谢HTML解析器将文本从身体中提取出来(在java中)
0
A
回答
1
我只是做,现在使用HTMLParser的,可在SourceForge: http://sourceforge.net/projects/htmlparser/
似乎很容易和简单,但既然你自称是在这个新的,这里是源代码的例子: http://kickjava.com/src/org/htmlparser/parserapplications/StringExtractor.java.htm
3
我发现这个html解析器非常有用。它还提供了一个示例。 http://jericho.htmlparser.net/docs/index.html
相关问题
- 1. 从Python解析HTML中提取文本
- 2. 从HTML中提取文本
- 3. 从html中提取文本?
- 4. 在PHP中解析HTML并提取值
- 5. 从html解析器中获取元素
- 6. HTML解析器获取链接文本
- 7. grep来提取出从HTML
- 8. 如何从HTML中解析文本
- 9. 使用PHP将文本从PDF中提取出来
- 10. 从xml解析的html标签之间提取文本
- 11. 从html文件中提取文本
- 12. 从html文件中提取文本python
- 13. Python:从html文件中获取和解析文本
- 14. HTML解析Java中
- 15. 解析HTML Java中
- 16. 如何在java中使用jsoup提取/解析这个html表?
- 17. 如何仅从HTML文档中提取粗体文本?
- 18. 如何从ckeditor生成html中提取纯文本在JAVA
- 19. Java来HTML解析器/状态机
- 20. 通过使用C解析文本从文本文件中提取文本#
- 21. 从类“解析”中获取文本opennlp
- 22. 如何在Java中使用Apache Tika的HTML解析器来提取所有HTML标记?
- 23. preg_match,regexp,php,从html中提取文本
- 24. 使用jquery从html中提取文本
- 25. 从HTML(Perl)中提取文本
- 26. 使用python从html中提取文本
- 27. 使用Javascript从HTML中提取文本
- 28. xcode - 从html代码中提取文本
- 29. sed命令从HTML中提取文本
- 30. 从html邮件中提取文本odoo
选择http://stackoverflow.com/search?q=java+html+parser – 2010-04-16 14:57:20