我必须以java语言分割输入文本文件(使用印地语言)的字符串。 有没有办法做到这一点?我试图把它分成单个字符,但没有字。例如:如何将输入字符串分割为相应的utf-charcters?
मुझे बहुत सारा काम करना है|
然后输出应该
मु
झे
ब
हु
त
सा
रा
का
म
क
र
ना
है
我必须以java语言分割输入文本文件(使用印地语言)的字符串。 有没有办法做到这一点?我试图把它分成单个字符,但没有字。例如:如何将输入字符串分割为相应的utf-charcters?
मुझे बहुत सारा काम करना है|
然后输出应该
मु
झे
ब
हु
त
सा
रा
का
म
क
र
ना
है
尝试了这一点
String s = new String("मुझे बहुत सारा काम करना है");
for(int i =0 ;i<s.length();i++){
System.out.println(s.charAt(i));
}
拉丁和梵文是不同的。你的代码会给出输出,例如“我的代码是” '。但实际情况应该像''重要的是''。你应该使用不同的算法或正则表达式。 – SibiCoder
这将解决你的问题
BufferedReader in = null;
try {
in = new BufferedReader(new FileReader("your text file path goes here"));
String read = null;
while ((read = in.readLine()) != null) {
String[] splited = read.split("\\s+");
for (String part : splited) {
System.out.println(part);
}
}
} catch (IOException e) {
System.out.println("There was a problem: " + e);
e.printStackTrace();
} finally {
try {
in.close();
} catch (Exception e) {
}
}
}
注: - provid e文件读取器的完整文件路径。
上面的代码是否回答这个问题? –
在Java中处理的所有字符串数据类型都是'Unicode',因此您可能会得到意想不到的结果。您可以参考this question。我认为,这似乎是类似的问题
告诉我们你的工作 – Sanka