你能指点我的工具将日文字符转换为unicode吗?如何在日语中将日文字符转换为unicode?
回答
CPAN给我“Unicode::Japanese”。希望这有助于开始。你也可以看Character Encodings in Perl和perl文档的文章unicode了解更多信息。
s/artical/article/ – 2010-05-18 15:50:37
布拉德,你有编辑权力。 :) – 2010-05-18 22:58:09
为什么 - 是吗?这是唯一的错误:)。 – Space 2010-05-20 04:57:17
use Encode qw(decode encode);
my $bytes_in_sjis_encoding = "\x88\xea\x93\xf1\x8e\x4f";
my $unicode_string = decode('Shift_JIS', $bytes_in_sjis_encoding); # returns 一二三
my $bytes_in_utf8_encoding = encode('UTF-8', $unicode_string); # returns "\xe4\xb8\x80\xe4\xba\x8c\xe4\xb8\x89"
对于命令行批量转换,使用piconv:
piconv -f Shift_JIS -t UTF-8 <infile> outfile
首先,你需要找出源文本的编码,如果你不知道它了。
日本最常见的编码是:
euc-jp
:(常用于Unix系统和一些网页等比shift-jis
更大Kanji报道)shift-jis
(微软还增加了一些扩展,按住Shift JIS被称为cp932
,这是经常使用的非Unicode Windows程序)iso-2022-jp
是一个遥远的第三
许多语言的通用编码转换库是iconv
(请参阅http://en.wikipedia.org/wiki/Iconv和http://search.cpan.org/~mpiotr/Text-Iconv-1.7/Iconv.pm),它支持many other encodings以及日语。
这个问题对我来说似乎有点含糊,我不确定你在问什么。通常你会用这样的东西:
open my $file, "<:encoding(cp-932)", "JapaneseFile.txt"
打开日文字符的文件。然后Perl会自动将其转换为内部的Unicode格式。
- 1. 如何将印度语字符转换为Unicode转义字符
- 2. Cocoa/Objective C:使用日语Unicode字符将数字转换为字符串
- 3. 如何从文本文件中将字符串转换为unicode?
- 4. 将字符串转换为日期并将日期转换回字符串
- 5. 将日志条目转换为UniCode
- 6. 如何将Unicode转义序列转换为.NET字符串中的Unicode字符?
- 7. 在PHP中,如何将字符串转换为日期?
- 8. 如何在mysql中将字符串转换为日期?
- 9. 如何在.NET中将字符串转换为日期时间?
- 10. 如何在java中将字符串转换为日期
- 11. 如何在PHP中将字符串转换为日期?
- 12. 如何在PHP中将日期转换为字符串?
- 13. 在Unicode中将unicode字符串转换为可用的unicode
- 14. 如何将字符串转换为Perl中的unicode字符串
- 15. 如何将unicode字符转换为java中的实际字符?
- 16. 如何将Unicode字符转换为Java中正确的语言字符?
- 17. 将日期转换为Windows中语言环境的字符串
- 18. URL转义为Internet Explorer的中文/日文Unicode字符
- 19. 将字符串转换为日期
- 20. 将字符串转换为日期php
- 21. 将字符串转换为日期
- 22. 将字符串转换为IST日期
- 23. 将日期转换为字符串
- 24. Swift将字符串转换为日期
- 25. 将日期转换为字符串
- 26. 将日期转换为字符串SQL
- 27. NSDateformatter将日期转换为字符串
- 28. Bash - 将字符串转换为日期
- 29. nsdateformatter ---将字符串转换为日期
- 30. 将字符串转换为日期
你是指从亚洲字符集。您需要先了解日语的哪种字符编码,然后才能做到这一点。 – 2010-05-18 08:51:22