我有一段Java代码正在检查它是两个Unicode字符之间:Unicode字符u00ff
LA(2) >= '\u0003' && LA(2) <= '\u00ff'
我明白\u0003
代表END OF TEXT
和\u00ff
是LATIN SMALL LETTER Y WITH DIAERESIS
,但什么介于这些点? (检查LA(2)是什么?)
例如,是拉丁字符,数字字符还是带有口音的字符,所有ASCII字符或其他?
我有一段Java代码正在检查它是两个Unicode字符之间:Unicode字符u00ff
LA(2) >= '\u0003' && LA(2) <= '\u00ff'
我明白\u0003
代表END OF TEXT
和\u00ff
是LATIN SMALL LETTER Y WITH DIAERESIS
,但什么介于这些点? (检查LA(2)是什么?)
例如,是拉丁字符,数字字符还是带有口音的字符,所有ASCII字符或其他?
它是Latin 1减去代码点U + 0000,U + 0001和U + 0002。这包括美国键盘上常见的东西,大量的控制字符(在U + 0020之下和U + 007F和U + 009F之间)以及一些其他拉丁字符,可用于编写大部分西欧语言。
以下范围声明:
0000 - 007F C0 Controls and Basic Latin
0080 - 00FF C1 Controls and Latin-1 Supplement
要检查哪些Unicode值代表的性格,我建议有一个看看下面的链接之一:
请在[Unicode代码表](http://www.unicode.org/charts/PDF/U0080.pdf)(PDF)上自己查看。 –