-1
A
回答
0
是有。
一种方法是获取所有需要的Unicode字符的列表,并以编程方式搜索您的String
。
例如,平方公里包含标,和Unicode值u00B2
因此,请检查您的String
线沿线的:
if(yourString.contains("\u00B2")){
System.out.println("yay");
}
0
1纯净的Unicode
以下将用e替换脚本上标/下标中未包含的所有Unicode字符空字符串,只留下超/下标。
问题是存在没有归类的上标和下标,如²³
。看维基百科。这些必须列出。
System.out.println(s.replaceAll("(?U)[^²³\\p{InSuperscripts_and_Subscripts}]", ""));
boolean isSuperOrSubscript(int codePoint) {
return Character.getName(codePoint).contains("SUPERSCRIPT")
|| Character.getName(codePoint).contains("SUBSCRIPT")
|| new String(new int[] {codePoint}, 0, 1)
.matches("(?U)\\p{InSuperscripts_and_Subscripts}");
}
但是,上述情况不会发现ᵈ
例如。
2 PDF样式文本
PDF是一种 “类型设置为” 原始样式文本。因为这样的上标可能会更小一点的文字移动一点。原来的<sup>...</sup>
(说)不再可用。可能由人类通过其字体资源在PDF中为较小的字体。
在这种情况下,您可能会遍历文本元素并查看定位。例如用itext库。不好玩。
相关问题
- 1. Java,如何检查一个字符串是否包含数字?
- 2. 如何在Javascript中检查字符串包含字母字符
- 3. 检查字符串包含Unicode字符
- 4. 检查字符串包含的字符
- 5. 检查字符串包含在Python
- 6. Java:检查字符串是否包含多个字符
- 7. 如何检查字符串是否包含C#中的字符?
- 8. 如何检查字符串是否包含某个字符?
- 9. 如何检查字符串中包含字符“+”
- 10. 如何检查是否字符串包含数字符号
- 11. 包含在字符串列表中的检查字符串
- 12. 检查字符串包含在字符串
- 13. 的Java:如何检查是否字符的字符串中包含
- 14. 检查一个字符串包含在单词中的Java
- 15. 检查是否字符串包含“HTTP://”
- 16. 检查行是否包含字符串
- 17. K#检查包含字符串
- 18. JQuery字符串包含检查
- 19. 检查字符串是否包含字(不是子字符串!)
- 20. 如何在golang中检查文件是否包含字符串?
- 21. 如何检查一个字符串是否包含在ArrayList中?
- 22. 检查字符串是否包含任何非数字字符 - 没有库 - Java
- 23. 如何检查字符串是否包含PowerShell中的数字
- 24. 如何检查字符串是否只包含英文字母?
- 25. Smalltalk:如何检查一个字符串只包含数字?
- 26. 如何检查一个字符串是否包含任何一些字符串
- 27. 字符串包含Java
- 28. 如何检查字符串是否包含Java中的数字格式?
- 29. 如何检查一个字符串是否包含多个数字(java)?
- 30. 如何检查字节数组是否包含Java中的Unicode字符串?
*“从pdf文档中提取的字符串”* - 该字符串是如何从PDF中提取的?字符串是否包含上标/下标或者是在提取过程中丢失的细节?目前对你的问题的回答假设前者,但你提到字符串的来源似乎指向后者。 – mkl