1
A
回答
1
您可以使用下面的代码从字符串中仅提取HTML标记。
package com.overflow.stack;
/**
*
* @author sarath_sivan
*/
public class ExtractHtmlTags {
public static void getHtmlTags(String html) {
int beginIndex = 0;
while(beginIndex!=-1) {
beginIndex = html.indexOf("<", 0);
int endIndex = html.indexOf(">", beginIndex+1);
String htmlTag = "";
try {
if(beginIndex!=-1) {
htmlTag = html.substring(beginIndex, endIndex+1);
}
} catch(Exception e) {
e.printStackTrace();
}
System.out.println(htmlTag);
html = html.substring(endIndex+1, html.length());
}
}
public static void main(String[] args) {
String html = "<html><body><h2>List HTML tags from a String</h2>hello<br /></body></html>";
ExtractHtmlTags.getHtmlTags(html);
}
}
但是,我不明白你想要用提取的HTML标签做什么。祝你好运!
0
从的HtmlUnit解析器可以接受字符串并返回一个结构化的结果:
http://htmlunit.sourceforge.net/apidocs/com/gargoylesoftware/htmlunit/html/HTMLParser.html
1
您可以尝试http://jsoup.org/ 不知道它允许获得的标签列表,但你可以获取列表迭代DOM 。
0
page = Nokogiri::HTML(open('http://yoursite.com'))
page.css("*").map{|x| x.name}.flatten.uniq
相关问题
- 1. 从字符串中删除html标记
- 2. 从字符串中删除html标记
- 3. 从字符串呈现html标记
- 4. 从字符串获取HTML标记
- 5. jquery从html字符串中删除html标记
- 6. 将字符串标记为HTML安全
- 7. 转换HTML标记字符串
- 8. PHP爆炸字符串由HTML标记
- 9. 获取HTML标记作为字符串
- 10. 如何从PHP中的字符串获取html标记?
- 11. 仅使用Javascript从HTML字符串中提取元标记
- 12. 使用jQuery从字符串中删除HTML标记
- 13. 从字符串中删除HTML标记的正则表达式
- 14. 从翻译字符串中剥离HTML标记
- 15. 从HTML字符串中除去所有标记属性
- 16. 从字符串中删除部分html标记
- 17. 使用java从字符串中删除html标记
- 18. 标记字符串
- 19. VBA从字符串中删除HTML标记仅删除第一个字符
- 20. 如何从PHP字符串中去除字符而不会干扰HTML标记
- 21. 以HTML标记形式输出字符串内容
- 22. 从字符串中打印出HTML标签
- 23. PHP字符串不输出html标签?
- 24. 分割字符串从文本和HTML标记
- 25. 如何从给定的字符串获取外部HTML /标记?
- 26. 从字符串剥离html标记,css和js代码
- 27. SWIFT 2.3 - 从取自JSON网址的字符串取出HTML标记
- 28. 字符串格式的HTML特定标记的Unescape字符java
- 29. 从标记字符串创建节点
- 30. 如何从标记字符串中转义特殊字符?
看看这里,我想你会找到你想要的一切 - > http://java-source.net/open-source/html-parsers – tartak 2012-03-05 11:59:43
你也许可以使用Jtidy,查看http:// jtidy.sourceforge.net/howto.html – Sap 2012-03-05 12:00:34
http://htmlcleaner.sourceforge.net – edze 2012-03-05 12:02:36