2011-04-06 52 views
2

在Spidermonkey shell中,使用read()函数读取文件会忽略该文件的编码。有什么方法可以读取UTF-8或其他多字节编码文件并保留多字节字符? Spidermonkey就是这样一个小魔鬼。使用unicode在Spidermonkey中读取()

+1

“Spidermonkey就是这样一个小恶魔”,不错的一个大声笑 – rsplak 2011-04-06 20:38:14

回答

1

所以我跟Mozilla的JS家伙交谈。原来这不是完全可能的,所以他们添加了一个命令行标志来启用对于read()snarf()的UTF-8支持。

/usr/bin/js -e "print(read('filexyz.txt'))" -U 

为了获得Spidermonkey的副本,您必须使用Tracemonkey存储库。你可以用Mercurial得到:

hg clone http://hg.mozilla.org/tracemonkey/ 
+1

这已经改变了。 'read()'和'snarf()'现在总是UTF-8。事实上,没有办法关闭它,所以如果你有一个非UTF-8文件,这可能真的很烦人。 :-P – 2012-04-25 16:45:46