2017-09-04 57 views
3

如何在代码点上分割字块集群?Perl中的代码点拆分

样品:

"స్వాగతం".comb() 
--> output (స్ వా గ తం) 

我如何获得以下?

(స ్ వ ా గ త ం) 

回答

6

首先转换为分解代码点(.NFD),再转换回字形试(.chr):

dd "స్వాగతం".NFD>>.chr # ("స", "\x[c4d]", "వ", "ా", "గ", "త", "ం") 

我不知道为什么«్呈现为"\x[c4d]"这里。也许这指向一个错误。

+0

'use strict;使用utf8; binmode STDOUT,“:encoding(UTF-8)”;打印“స”。 “ా”;'请把这个perl5翻译成perl6 – rx57

+2

'print“స”〜“”ా“#స”ా'。换句话说,用'〜'代替'.'? 'use strict','use utf8'和'binmode STDOUT,':encoding(UTF-8)“'都是默认在Perl 6中设置的。就我记得Perl 5而言,我必须承认。 –

+0

perl5和perl6的输出是不同的 – rx57