2017-02-23 92 views
1

我想要一个瑞典文txt文件。Ubuntu/Bash上的字符编码问题

对于特殊字符(如ä或é),我找回这些字符: 。

例如。 r汉族Apornas星球。

我有来自多个来源的多个文件,其中一些给出了正确的结果(例如Dethaärärfel!),其中一些产生了上述问题。

基于这一点,我很确定,问题在于文件的字符(编码),但我只是无法找到如何在命令行编码文件。

我已经试过:

iconv -f UTF-8 -t UTF-16 file.txt 

和同类者。 但是我一直在出错信息。

您有任何提示吗? 谢谢!

+0

'chardet file.txt'的输出是什么? –

+0

瑞典最常见的编码是'iso-8859-1'和'utf-8'。在现代系统上,'iconv -f iso-8859-1 -t utf-8 file.txt'应该这样做。在一个蹩脚的旧PuTTY或古老的linux发行版中,'iconv -f utf-8 -t iso-8859-1 file.txt'会。 –

+0

@RicardoBranco,谢谢,那是我失踪的命令,我没有! –

回答

1

基于注释的解决方案是:

首先执行:

chardet file.txt 

找出字符编码。

然后:

iconv -f iso-8859-1 -t utf-8 file.txt 

打造的 “翻译”。