我正在尝试将包含类别和标签的1000个文章网站(ASP SQL Server)导出到WordPress博客中。这些文章最初是用Microsoft Word编写的,并包含许多非UTF-8字符。然后他们被复制并粘贴到Microsoft Access中。这些文章目前存储在SQL Server 2008数据库中,并使用iso-8859-1字符集在网站上显示。将字符集ISO-8859-1转换为UTF-8编码
我使用默认的WordPress导入/导出xml文件(WordPress eXtended RSS(WXR)文件)从WordPress导出博客时使用的文件复制。该文件需要UTF-8编码。
我的问题是,ISO-8859-1字符打破进口商,许多文章没有完全导入。字符,如这些
naïve ,
and funny characters such as “ ’
我的问题是我怎么收拾所有的文字,我可以创造一个替换功能来清理搞笑语录,但总是会有一个随机单词一样幼稚,这将导致一个问题?
将所有文本的编码从iso-8859-1转换为UTF-8的最简单方法是什么?