2016-07-07 53 views
0

是否有方法从文本文件中读取文本并将Latin-4(ISO/IEC 8859-4)或Latin-6(ISO/IEC 8859-10)字符转换为相应的HTML代码(反之亦然) R和RStudio中的,例如ą&261;如何将国际(立陶宛)字符翻译为R中的相应HTML代码?

我特别感兴趣的是对这些符号进行编码解码:这是我的最爱。 我正打算使用正则表达式完成此任务,但第一个问题是,我RStudio甚至不读符号正确:

c("Ąą Čč Ęę Ėė Įį Šš Ųų Ūū Žž") 

结果是:

[1] "Aa Cc Ee Ee Ii Uu Uu ˇ˛" 

回答

1

好,最好R包来读取非ASCII语言环境的东西是Hadley Wickham的readr

您可以从here安装它并检查它是否支持Latin-6