我正试图解决从java中的原始文本中删除符号和特殊字符并找不到方法。文本摘自网站上的自由文本字段,可能包含任何字面意思。我正在从外部来源获取此文本,并且无法控制更改设置。所以我必须在我的最后工作。 一些实例是删除Java中的特殊字符字符串
1)贝伦应该是 - >贝伦
2)阿里亚纳应该是 - >阿里亚纳
3)哈林应该是 - >哈林
4)YZ ️应该是 - > YZ
5)ここさけは7回は见に行くぞ应该是 - >ここさけは7回は见に行くぞ
6)دميازرقوونيازرق应该是 - >دميازرقوطنيازرق
任何帮助吗?
因此,通过 “特殊字符” 你的意思是表情符号?你有什么尝试? – Sinkingpoint
你可以尝试使用正则表达式。例如:'yourString.replaceAll(“\\ W”,“”)'去除所有非单词字符。请参阅[正则表达式](https://www.tutorialspoint.com/java/java_regular_expressions.htm) –
[Emoji值范围]的可能重复(https://stackoverflow.com/questions/30470079/emoji-value-range) – selbie