Perl中的代码点拆分

如何在代码点上分割字块集群？Perl中的代码点拆分

样品：

"స్వాగతం".comb() 
--> output (స్ వా గ తం)

我如何获得以下？

(స ్ వ ా గ త ం)

2017-09-04 rx57

首先转换为分解代码点（.NFD），再转换回字形试（.chr）：

dd "స్వాగతం".NFD>>.chr # ("స", "\x[c4d]", "వ", "ా", "గ", "త", "ం")

我不知道为什么«్呈现为"\x[c4d]"这里。也许这指向一个错误。

2017-09-04 19:14:02

'use strict;使用utf8; binmode STDOUT，“：encoding（UTF-8）”;打印“స”。 “ా”;'请把这个perl5翻译成perl6 – rx57

'print“స”〜“”ా“＃స”ా'。换句话说，用'〜'代替'.'？ 'use strict'，'use utf8'和'binmode STDOUT，'：encoding（UTF-8）“'都是默认在Perl 6中设置的。就我记得Perl 5而言，我必须承认。 –

perl5和perl6的输出是不同的 – rx57

回答