因此,我正在开发一个纯C(ANSI 9899:1999)项目,并试图找出重新开始的地方:Unicode,UTF-8和所有爵士乐。我在哪里可以开始使用C语言中的Unicode编程?
具体来说,它是一个语言解释器项目,我有两个主要的位置,我需要处理Unicode:在源文件中读取(该语言表面上支持Unicode标识符等)以及'string'对象中。我很熟悉所有关于Unicode,UTF-7/8/16/32 & UCS-2/4的所有明显的基础知识,等等......我主要是在寻找有用的,特定于C的(也就是说,请不要使用C++或C#,这是以前在SO上记录的所有内容)资源,对于我的'下一步'来实现Unicode友好的内容...在C.
任何链接,manpages,维基百科文章,示例代码,都非常受欢迎。我还会尝试在原始问题中保留这些资源的列表,以供任何稍后发生的人员使用。
- 一个必须考虑任何事情之前阅读,如果你不熟悉的Unicode,什么编码实际上是:http://www.joelonsoftware.com/articles/Unicode.html
- 的UTF-8家页:http://www.utf-8.com/
man 3 iconv
(以及iconv_open
和iconvctl
)- International Components for Unicode(经由Geoff Reedy)
libbasekit
,这似乎包括光Unicode的搬运工具- Glib有一些Unicode函数
- 基本UTF-8 detector功能,通过Christoph
1为的iconv,只要它是可用的。在Windows上icu可能是一个更好的选择 – 2010-02-09 22:54:11