2012-03-13 64 views

回答

2

似乎没有任何字符编码问题,只是虚假的数据,即字节0xC3 0x82,它表示字符Â解释为UTF-8,这是声明的编码。否则,内容看起来都是ASCII,因为这些名字是“国际化的”,即英语形式,例如,德约科维奇代替Đoković,索德林代替索德林等等。有了这些数据,你怎么声明它的编码并没有多大关系,因为无论如何,ASCII字符大多具有相同的表示。

我不知道字节来自哪里,但他们似乎系统地出现在逗号和空格之间,所以它显然是生成表的代码中的东西。

+0

我还没有解决这个问题。 – Alin 2012-03-14 12:47:21

+0

我认为你的回答对我来说是有点意思的。在我的网站中,我做了以下工作:我从另一个网站上获取一些内容并将其保存到一个mysql表格中。然后以某种方式处理数据并显示它我自己的网站。我刮的网站只显示英文字符,(Soderling不是Söderling)。使用php查看表格我的管理员显示正确,就像我抓取的内容一样。当我在本地主机上显示它时,它显示正常。当我在我的现场网站上显示它时,它显示混乱。例如:德约科维奇,诺瓦克。 – Alin 2012-03-14 13:15:16

+0

我觉得有一些我忘了提及。有一个奇怪的字符 (其中包括逗号后的空白空间)。我想这是什么被误解成。问题是我试图摆脱它时过滤信息从scraped网站之前保存到mysql和失败。我试过修剪,str_replace('&nbsp','',$ someword),但它仍然被保存到MySQL表。 – Alin 2012-03-14 13:23:52

相关问题