我想解析(窃取)来自HTML页面的大量信息。很多信息都是封闭的。像:用户名:1.age 2.gender 3.country等这是一个非常大的块,因此我的正则表达式模式是巨大的。我所有的正则表达式开发工具都有一行模式和文本文本框。这使得开发这些大型模式变得不可能。我想要做什么来开发大型正则表达式模式还是避免它们?如何在Java中创建大型正则表达式模式?
-1
A
回答
2
HTML页面基本上是一个有效的DOM结构。所以最好使用DOM解析器而不是正则表达式来获得所需的信息。您可以探索JSoup:Java HTML解析器。
0
使用为HTML描述的解析规则从text/html资源生成DOM树。这些规则一起定义了所谓的HTML解析器。
相关问题
- 1. 创建正则表达式模式
- 2. 创建正则表达式模式
- 3. 正则表达式,创建子模式
- 4. 正则表达式模式在Java中
- 5. Java中的正则表达式模式
- 6. 创建正则表达式
- 7. 正则表达式创建
- 8. 如何创建此正则表达式
- 9. 如何创建正则表达式
- 10. 如何创建php正则表达式
- 11. 如何为这个模式创建正则表达式/ posts /:post_id?
- 12. 如何在Java正则表达式中获取组的模式?
- 13. 如何在正则表达式中使用Java lambda表达式
- 14. 正则表达式模式Java
- 15. 模式Java - 正则表达式
- 16. Java的模式正则表达式
- 17. Java正则表达式模式太长?
- 18. Java正则表达式模式查询
- 19. Java模式匹配正则表达式
- 20. 的Java模式的正则表达式
- 21. Java正则表达式模式
- 22. Java正则表达式匹配模式
- 23. Java正则表达式匹配模式
- 24. Python正则表达式模式建议
- 25. Java中的正则表达式:如何引用“匹配模式”?
- 26. 正则表达式 - 模式
- 27. 正则表达式模式
- 28. 正则表达式模式
- 29. 正则表达式模式
- 30. 正则表达式模式
HTML页面基本上是DOM结构。所以最好使用DOM解析器而不是正则表达式来获得所需的信息。 –
我开始不关心有问题的问题和downvotes。这太令人讨厌了。无论如何,我得到了我的答案。嘿嘿〜 –