Java中的编码问题

/** 
* Sets a statement parameter as NCHAR. Use before setting the field value. 
* @param pstmt the prepared statement 
* @param index the parameter index 
*/ 
public static void setNChar(PreparedStatement pstmt, int index) { 
    OraclePreparedStatement opstmt = (OraclePreparedStatement)pstmt; 
    opstmt.setFormOfUse(index, OraclePreparedStatement.FORM_NCHAR); 
}

如果使用普通的SQL字符串使用Unicode字符，可以作为甲骨文得到所有的SQL命令UTF-8：驱动程序自动翻译。但是，对于准备好的语句使用你需要明确地告诉oracle。

如果您运行Java 6并具有ojdbc6驱动程序，您也可以尝试PreparedStatement.setNString()。（在我的情况下，我们必须使用Java 5与版本4驱动程序 - 不要问为什么）

（注意：我知道这是供应商锁定，因为您被迫使用具体的oracle类而不是jdbc接口）

来源

2009-06-23 07:13:22 akarnokd

首先，你需要知道文件的编码。用hexeditor打开它。一个字符占用多少字节？如果它只有一个，那么该文件不是UTF-8，而更可能是某些ISO-8859或类似的Windows编码（例如Win-1252）。如前所述，机会是ISO-8859-1是正确的编码。对于东欧语言，ISO-8859-2将是正确的选择。

第二个问题是您的数据库支持字符列的字符集（该参数在安装/创建新实例期间设置），但由于您可以直接插入这些字符，因此在这种情况下它不会成为问题。

您使用哪个jdbc驱动程序？如果客户端的NLS_LANG设置与数据库的字符编码不匹配，那么精简驱动程序不应该在这方面发生任何问题，而OCI驱动程序可能会产生额外的问题层。

来源

2009-06-23 07:44:31

我认为Oracle 10g允许您为国家字符集列存储格式使用UTF-8或UTF-16。默认情况下它是UTF-16。 – akarnokd 2009-06-23 08:23:56

kd304：您还可以指定UTF-8作为CHAR（VARCHAR，VARCHAR2）列的字符集，因此数据库中的每个字符串都是UTF8。 – 2009-06-23 08:58:34

您需要在ISO 8859-1中编码，而不是在UTF-8中编码。

来源

2009-06-23 08:08:37

如果他/她以UTF-8接收数据，他/她为什么要将其转码为较小的格式？ Oracle能够处理unicode文本。 – akarnokd 2009-06-23 08:25:32

您可以手动比较字符输出的十六进制转储和各种编码（sample code），虽然这可能是一个费力的过程。或者，您可以使用ICU库尝试使用determine the encoding，虽然这不是一个简单的方法。

CSV文件是如何生成的？如果它是由英文OS上的Windows应用程序创建的，则编码可能是windows-1252（canonical name "Cp1252" in Java）;在波兰系统上，它可能是windows-1250。最好的方法是找出保存文件的编码方式。

来源

2009-06-23 08:58:39 McDowell

第一件要做的事情就是从文件中加载字符串的System.out.println（）。如果它在控制台中损坏，那么你的文件实际上并不是UTF-8，如果它看起来很好，那么你将它保存到数据库的方式有问题:)

来源

2009-06-23 12:07:27 Spyder

Java中的编码问题

回答

相关问题