utf-32

0热度

1回答

#include <stdio.h> #include <iostream> #include <locale> int main() { const wchar_t *str = L"\u041F\u043E\u0440\u044F\u0434\u043E\u043A"; std::locale::global(std::locale("")); std:

3热度

1回答

在Qt QTextCodec :: codecForName（“UTF-16”）和codecForName（“UTF-32”）如何决定使用的字节顺序？

在Qt文档它指出（除了别的以外）以下Unicode字符串编码被支持： UTF-8 UTF-16 UTF-16BE UTF-16LE UTF-32 UTF-32BE UTF-32LE 由于对2和4个八位字节列出的三种不同编解码器编码的Unicode，我想知道：如何做两个非端的编解码器（“UTF-16”和“UTF-32”）决定哪些字节序使用？

2热度

1回答

转换UTF-8为UTF-32，预先计算每个字符的数量

我有一个工作算法来将UTF-8字符串转换为UTF-32字符串，但是，我必须分配所有的提前为我的UTF-32字符串提供空间。有什么办法可以知道UTF-32字符串将占用多少字符。例如，UTF-8字符串“¥0”是3个字符，并且一旦转换为UTF-32就是2个无符号整数。有没有什么方法可以知道在转换之前我需要的UTF-32字符的数量？或者我将不得不重新编写算法？

8热度

2回答

如何在Python中获得可靠的unicode字符数？

Google App Engine使用Python 2.5.2，显然在启用UCS4的情况下。但GAE数据存储在内部使用UTF-8。所以，如果你存储U '\ ud834 \ udd0c'（长2）到数据存储，当你找回它，你会得到 '\ U0001d10c'（长度为1）。我试图在存储它之前和之后给出相同结果的方式来计算字符串中的Unicode字符数。所以我想，我接受它，计算它的长度，并把它的数据存储之前

18热度

1回答

为什么没有UTF-24？

可能重复： Why UTF-32 exists whereas only 21 bits are necessary to encode every character? 最大Unicode代码点是在0x10FFFF在UTF-32。 UTF-32有21个信息位和11个多余的空白位。那么，为什么没有UTF-24编码（即删除高位字节的UTF-32）来存储3个字节而不是4个编码点？

46热度

5回答

UTF-16的意义何在？

我从来没有理解UTF-16编码的要点。如果您需要将字符串视为随机访问（即代码点与代码单元相同），那么您需要使用UTF-32，因为UTF-16仍然是可变长度。如果你不需要这个，那么与UTF-8相比，UTF-16看起来像是一个巨大的空间浪费。 UTF-16相对于UTF-8和UTF-32的优点是什么？Windows和Java为什么使用它作为它们的本地编码？

1热度

1回答

如何将U + 20000之类的utf-32代码转换为VBA中的字符？

如果s包含20000和j是Len(s)以下 Dim b(1 To 8) b() = ChrW("&H" & Mid$(s, 1, j - 4)) & ChrW("&H" & Mid$(s, j - 3)) 不起作用。它返回2个字符，而U + 20000是单个。

7热度

2回答

什么开源C或C++库可以将任意UTF-32转换为NFC？

什么开源的C或C++库可以将任意UTF-32转换为NFC？我认为可以做到这一点的图书馆：ICU，Qt，GLib（不确定？）。我不需要任何其他复杂的Unicode支持;只是从任意但已知正确的UTF-32转换为NFC形式的UTF-32。我对可以直接做这件事的图书馆最感兴趣。例如，Qt和ICU（据我所知）通过UTF-16的中间转换阶段完成所有工作。

1热度

1回答

从文件中读取文本并将其转换为UTF32

我正在使用CSFML 1.6库（基于OpenGL的多媒体库）。我住在波兰，在这里我们有特殊字符，如： ąęźćół 现在我有这个由字符和CSFML报价功能设置UnicodeText上显示的字符串文本文件，它的参数是int型数组。如何正确读取文件中的字符，然后将它们传递给此函数？任何帮助真的很感激。

4热度

1回答

如何将UTF-16转换为UTF-32并在C中打印结果wchar_t？

我想打印出一串UTF-16字符。我后来发布了这个问题，给出的建议是使用iconv转换为UTF-32并将其打印为wchar_t字符串。我做了一些研究，并成功地编写以下： // *c is the pointer to the characters (UTF-16) i'm trying to print // sz is the size in bytes of the input i'm tr