我具有被unix下描述为一个文件:的iconv unicode的未知的输入格式
$file xxx.csv
xxx.csv: UTF-8 Unicode text, with very long lines
查看它在less
/vi
将呈现一些特殊字符(SSA°...)不可读(├╝); Windows也不会显示它;直接将它导入数据库只会将特殊字符更改为其他特殊字符(+ä,+ñ,...)。
我想现在将它转换为带有iconv的“默认可读”编码。 当我尝试它使用UNICODE作为输入和UTF-8的iconv
$iconv -f UTF-8 -t ISO-8859-1 xxx.csv > yyy.csv
iconv: illegal input sequence at position 1234
转换为输出将返回相同的消息
我猜在文件中另一种格式有所编码,我不知道如何找出哪种格式,以便将其转换为“普遍”可读的格式...
尝试在文本编辑器中打开它,使您可以更改打开文件的编码。浏览器最糟糕的情况也会发生。然后玩弄可用的编码并查看正确显示字符的内容。 – deceze
我试着用记事本++,但它是680MB和记事本++告诉我这是太大.. –
该文件显然不是UTF-8,即使'文件'猜测它。你能否以十六进制形式向我们展示从偏移量1234开始的八个字节? –