2011-08-22 82 views

回答

0

嗯,这可以解释,但我认为Taiwanese locale的例子是一个更好的例子。根据维基百科,这名字叫嘉英,嘉陵江的嘉,英國的英是一系列中文字(我的名字是Jiāyīng)。 BreakIteator能够将其解码为分词。

+1

无论我在BreakIterator的getWordInstance()中使用哪种语言环境,它都会将“名字叫嘉英,嘉陵江的嘉,英国的英”分成三个单词(和“名字叫嘉英嘉陵江的嘉英国的英”逗号 - 只是一个字)。你使用哪对语言你会得到不同的结果? – Psychonaut