我有代码:正则表达式的正则表达式的Java字符串
private static final Pattern TAG_REGEX = Pattern.compile("<p>(.+?)</p>");
private static List<String> getTagValues(final String str) {
final List<String> tagValues = new ArrayList<String>();
final Matcher matcher = TAG_REGEX.matcher(str);
while (matcher.find()) {
tagValues.add(matcher.group(1));
}
return tagValues;
}
System.out.println(Arrays.toString(getTagValues(stringText).toArray()));
,我想从这个获得:
"<html><head></head><body><p>Aa , aa.</p><p><b>Aa aa, aa.</b></p><p>Aa aa aa, aa.</p><p><i>Aa, aa.</i></p><p><b><i>B, b, b.</i></b></p><b>Aa aa, aa.</b></body></html>"
我想只有文本beetwen <p>
和</p>
i want get only this:
"Aa aa Aa aa aa Aa aa aa aa Aa aa B b b"
但我不知道我要写什么Pattern.compile("");
有人帮忙?
这个'AA AA,AA。'可以在'
'和'
' –'Jsoup'也可以选择所有的'p'标签数据,但是再次发布的将是'Aa aa,aa。'因为不在'p'里面,并且在'p' –