2008-12-09 58 views
0

我有一些从CSV文件插入MySQL数据库的HTML,而该文件又是从访问MDB文件导出的。 MDB文件被导出为Unicode,实际上是Unicode。然而,我不确定是什么编码MySQL数据库。转换用于MySQL和JSON的unicode

但是,当我尝试回显存储在字段中的html时,没有Unicode。这是直接检索数据库中的一个html字段。

http://www.yousendit.com/download/TTZueEVYQzMrV3hMWEE9PQ

它说,在源utf-8。从呼应出article_desc实际产生的页面代码是在这里:

http://www.nomorepasting.com/getpaste.php?pasteid=22566

我需要使用这个网站使用JSON,我想知道我应该做的。我不能使用任何其他框架或库。我应该在将数据插入MySQL DB之前转换数据还是其他?

回答

2

该mdb文件导出为Unicode,实际上是unocode。

这没有任何意义。一个文件不能是unicode。它可以用Unicode或UTF-8编码,如utf-8或utf-16与BOM或..

字符集问题是一个非常普遍的问题,它的根源在于无知。我不会说这会冒犯你,但你确实需要知道代码点(字符串)和编码(字节流)之间的区别。如果您不知道在整个应用程序中始终处理的是哪个问题,则最终会出现问题。关于这些问题的诅咒是,它们只发生在边缘案例中,所以长期监督它们很容易,并且当您最终意识到某些错误时,它可能会在应用程序的完全不相关的部分中触发。这使得几乎不可能进行调试。