2016-08-01 80 views
0

如何找到Bartlomiej Zolc也拉丁版本字符串? 我目前的版本只匹配英文版本。如何通过规范化版本的字符串匹配拉丁字符和非拉丁字符?

regex101

/Bartlomiej Zolc/g 

hello Bartłomiej Żółć match me! 
hello Bartlomiej Zolc match me too! 
+1

标准化是区域设置相关的(即归特定的字符可根据语言而变化的结果),所以你应该按照正确的语言环境正常化的字符串*前*测试它针对您的正则表达式。 –

回答

0

这可能是比登天难归你对阵的东西,所以我建议改变正则表达式。

我不知道Ruby是否支持[=o=](与o及其所有重音版本匹配)POSIX bracket expression syntax,但也有另一种方法。

用带有字符类的替代重音形式替换每个字母。例如:

/Bart[lł]omiej [ZŻ][oó][lł][cć]/g