2011-11-19 170 views
2

作为标题,我不知道如何解析包含字母字符和来自其他语言的特殊字符的字符串C.任何人都请帮助我如何区分他们在C ?.我是否需要安装一些可选组件来帮助C接受字符?(我在Linux环境中)。非常感谢您的回复。在C/C++中解析包含字母字符和区域字符(法语,俄语,中文)的字符串

+0

有一些库,但是你可能需要在继续之前学习基本字符编码,因为你没有似乎对这个概念很熟悉。 –

+0

什么字符编码? UTF-8? UTF-16? UCS-32? –

+0

实际上,我想使用UTF-8进行编码,我想我需要在解决问题之前了解更多信息。非常感谢您的意见。不过,我真的很感激,如果任何人都可以给我一个示例代码来做到这一点在C. – Zuhakasa

回答

1

您至少需要决定要使用还是支持的character encoding(s)。之后,您将需要决定是否将国际字符串保留为原生形式,或者将它们使用libiconv之类的字符串转换为应用程序中的单个编码。因此,首先,正如Laurent在评论中指出的那样,您需要了解您正在尝试做什么(这不会很容易 - 公平的警告)。并且看看Joel Spolsky(Stack Overflow的联合创始人)多年前写了什么:http://www.joelonsoftware.com/articles/Unicode.html

+0

非常感谢您的链接约翰。 – Zuhakasa

+0

如果他们让你指出正确的方向,你可以考虑通过点击左边的复选标记来接受我的答案。 –