utf-32

    0热度

    1回答

    #include <stdio.h> #include <iostream> #include <locale> int main() { const wchar_t *str = L"\u041F\u043E\u0440\u044F\u0434\u043E\u043A"; std::locale::global(std::locale("")); std:

    3热度

    1回答

    在Qt文档它指出(除了别的以外)以下Unicode字符串编码被支持: UTF-8 UTF-16 UTF-16BE UTF-16LE UTF-32 UTF-32BE UTF-32LE 由于对2和4个八位字节列出的三种不同编解码器编码的Unicode,我想知道:如何做两个非端的编解码器(“UTF-16”和“UTF-32”)决定哪些字节序使用?

    2热度

    1回答

    我有一个工作算法来将UTF-8字符串转换为UTF-32字符串,但是,我必须分配所有的提前为我的UTF-32字符串提供空间。有什么办法可以知道UTF-32字符串将占用多少字符。 例如,UTF-8字符串“¥0”是3个字符,并且一旦转换为UTF-32就是2个无符号整数。有没有什么方法可以知道在转换之前我需要的UTF-32字符的数量?或者我将不得不重新编写算法?

    8热度

    2回答

    Google App Engine使用Python 2.5.2,显然在启用UCS4的情况下。但GAE数据存储在内部使用UTF-8。所以,如果你存储U '\ ud834 \ udd0c'(长2)到数据存储,当你找回它,你会得到 '\ U0001d10c'(长度为1)。我试图在存储它之前和之后给出相同结果的方式来计算字符串中的Unicode字符数。所以我想,我接受它,计算它的长度,并把它的数据存储之前

    18热度

    1回答

    可能重复: Why UTF-32 exists whereas only 21 bits are necessary to encode every character? 最大Unicode代码点是在0x10FFFF在UTF-32。 UTF-32有21个信息位和11个多余的空白位。那么,为什么没有UTF-24编码(即删除高位字节的UTF-32)来存储3个字节而不是4个编码点?

    46热度

    5回答

    我从来没有理解UTF-16编码的要点。如果您需要将字符串视为随机访问(即代码点与代码单元相同),那么您需要使用UTF-32,因为UTF-16仍然是可变长度。如果你不需要这个,那么与UTF-8相比,UTF-16看起来像是一个巨大的空间浪费。 UTF-16相对于UTF-8和UTF-32的优点是什么?Windows和Java为什么使用它作为它们的本地编码?

    1热度

    1回答

    如果s包含20000和j是Len(s)以下 Dim b(1 To 8) b() = ChrW("&H" & Mid$(s, 1, j - 4)) & ChrW("&H" & Mid$(s, j - 3)) 不起作用。它返回2个字符,而U + 20000是单个。

    7热度

    2回答

    什么开源的C或C++库可以将任意UTF-32转换为NFC?我认为可以做到这一点的图书馆:ICU,Qt,GLib(不确定?)。 我不需要任何其他复杂的Unicode支持;只是从任意但已知正确的UTF-32转换为NFC形式的UTF-32。 我对可以直接做这件事的图书馆最感兴趣。例如,Qt和ICU(据我所知)通过UTF-16的中间转换阶段完成所有工作。

    1热度

    1回答

    我正在使用CSFML 1.6库(基于OpenGL的多媒体库)。我住在波兰,在这里我们有特殊字符,如: ąęźćół 现在我有这个由字符和CSFML报价功能设置UnicodeText上显示的字符串文本文件,它的参数是int型数组。 如何正确读取文件中的字符,然后将它们传递给此函数? 任何帮助真的很感激。

    4热度

    1回答

    我想打印出一串UTF-16字符。我后来发布了这个问题,给出的建议是使用iconv转换为UTF-32并将其打印为wchar_t字符串。 我做了一些研究,并成功地编写以下: // *c is the pointer to the characters (UTF-16) i'm trying to print // sz is the size in bytes of the input i'm tr