0
我正在阅读一个Unicode流,宁可不必通过正则表达式传递整个字符串。是否有一个简单(可靠)的字符可以用来跨语言分类?如何确定C#中Unicode流中的单词边界?
我的字节数组很可能将设在UTF-16或UTF-8
我正在阅读一个Unicode流,宁可不必通过正则表达式传递整个字符串。是否有一个简单(可靠)的字符可以用来跨语言分类?如何确定C#中Unicode流中的单词边界?
我的字节数组很可能将设在UTF-16或UTF-8
如果您使用的是Java,那么你可以使用BreakIterator。