2014-11-25 46 views
0

我有一些法语代码点,我想在Linux系统上解码为utf-8。 我的文件的内容是(小例子):
问题:从命令行解码linux机器上的文件

Lemari%C3%A9%20

哪个解码应该是:Lemarié

我读到的iconv是实现这个伟大的工具,但我不知道我应-f参数中使用,因为文件的内容进行编码,所以我只能用-t选项尝试没有成功: iconv -t UTF8 test.csv

有何建议?

+0

什么是百分号?这使得它看起来像URL编码文本或其他东西。如果你的文件中有URL编码文本,那么我希望每个百分号都被UTF-8当作一个单独的字符处理。 [你上面的文本,URL解码](http://urldecode.org/?decode=Lemari%25C3%25A9%2520)和[正确的UTF-8字节序列应该是这样的](http://hexutf8.com/ ?q =#Lemarié) – jar 2014-11-25 15:21:34

回答

1

从手册页,以下是将输入从ISO88592编码格式转换为UTF8编码格式的命令。输出将是output.txt文件。

iconv -f ISO88592 -t UTF8 <input.txt> output.txt 

所以你的情况,-f应与输入文件的编码格式使用。像

iconv -f <input file encoding format> -t UTF8 <test.csv> output.txt 
+0

thx这已经很清楚了,问题是什么字符编码在处理编码的字符串时用作'-f' – JBoy 2014-11-25 10:25:03