2010-08-23 116 views
3

我试图找到一种解决方法,使用字符组合在unicode中显示旧的和罕见的字符。目前我正在将一些字典从EPWING转换为文本,并且有36个不同的字符不能使用普通的UTF-8进行再现。以下是我转换的字典之一的epwing gaiji到Unicode字符映射的问题部分,在某些区域它有一个有趣的语法,明显用于以不同方式组合字符。我希望如果有人能够确定这个语法是什么,以及我可以在哪里找到文档或教程如何使用它。如何将Unicode字符与汉字/汉字结合使用?

s/<?w=b02a>//g 
s/<?w=b04b>/者/g 
s/<?w=b064>/<⾱ >/g 
s/<?w=b077>/<彳<匕\/匕>>/g 
s/<?w=b07c>/<山\/⺀>/g 
s/<?w=b12e>//g 
s/<?w=b155>/</>/g 
s/<?w=b156>/<\/>/g 
s/<?w=b157>/<\/\/>/g 
s/<?w=b158>/<こ[1]/と|ヿ>/g 
s/<?w=b16f>/<㗢>/g 
s/<?w=b170>/<㗥>/g 
s/<?w=b171>/ଏ/g 
s/<?w=b175>/lb/g 
s/<?w=b22a>//g 
s/<?w=b234>/ff/g 
s/<?w=b25e>/㯌/g 
s/<?w=b271>/<扌 晉>/g 
s/<?w=b36b>//g 
s/<?w=b373>//g 
s/<?w=b42c>//g 
s/<?w=b434>/<已\/大>/g 
s/<?w=b438>//g 
s/<?w=b43a>//g 
s/<?w=b43f>/<㇀/丶>/g 
s/<?w=b440>//g 
s/<?w=b45a>/<?>/g 
s/<?w=b45b>/<|>/g 
s/<?w=b53d>/<?>/g 
s/<?w=b53e>/<?>/g 
s/<?w=b540>/<o>/g 
s/<?w=b537>/<ト モ>/g 
s/<?w=b541>/<一/>/g 
s/<?w=b544>/<?>/g 
s/<?w=b546>/<[r45]卐>/g 
s/<?w=b55f>/*/g 

我知道该行应该代表彳作为左垂直自由基与一个匕堆叠在另一个的顶部匕作为字符的右垂直部分:

s/<?w=b077>/<彳<匕\/匕>>/g 

这一个是也很明显,这是一个卐旋转45度:

s/<?w=b546>/<[r45]卐>/g 

注:后而来的四个字符的十六进制代码W =对于EPWING的标识符gaiji的unicode是SUP构成对应。

谢谢你的时间。

回答

4

请参阅The Unicode Standard第12.2节,表意描述字符。它讨论你的确切情况。

不幸的是,您可能发现软件支持您正在尝试做的事实际上并不存在。