编写一个简单的程序,从大的纯文本文件中提取所有邮政地址,由于某些地址使用非问题 - 标准字符。将纯文本文件中的UTF格式转换为vb.net中正确的UTF字符
这是从文件中的一些源文本我需要处理:
水坑谷德Louro,N = BA 97 Bloco 2,1 = BA甲
但它需要读取:
街谷德Louro,Nº97 Bloco 2,1º一个
现在很显然,我可以做一个简单的替换为这一个字,但我需要它与每个字符的工作。
BA是utf32中符号的十六进制值(虽然前面有一个零加载),所以如果我可以编写代码在字符串中找到所有这些“= xx”实例并将其替换为正确的utf字符,将解决它。但对于我的生活,我无法弄清楚如何。
任何人都可以帮忙吗?
感谢
相信“纯文本”⇒[巧合编程](https://pragprog.com/the-pragmatic-programmer/extracts/coincidence)。 – 2014-09-21 16:30:17
这里使用了两种编码。原始文本可能使用Windows 1252代码页,然后通过带引号的可打印编码器进行转换。发回它,你不需要它。 – 2014-09-21 16:46:04