2009-10-25 67 views
2

如何在Ruby中按Unicode范围拆分字符串。我想用逗号分割\ u1000和\ u1000。例如,我想拆分此字符串...用Ruby拆分Unicode字符串

我爱ျမန္မာ

这个...

我的爱,ျမန္မာ

您可能没有看到我的例子中的Unicode字符。它是Unicode范围\ u1000以上。

谢谢。

回答

2

取决于您使用的是哪个版本;这里是1.9的解决方案。我想1.8可能会变得丑陋。

这倒在优雅,但似乎工作。

"I love ျမန္မာ".gsub(/([\u0000-\u0999])([\u1000-\u9999])/, '\1,\2') 

如果此方法是合适的,你必须提供的其他情况下(高到低转换)