2012-01-15 41 views
-2

我有一个Tex文件。我想用C#将其转换为txt文件。 请帮忙。 我确定它包含的信息是纯文本,但使用的格式是Tex。Tex到txt转换使用C#

+0

Tex文件是否已经以纯文本格式? – zellio 2012-01-15 19:11:00

+0

@Mimisbrunnr:No;它通常只能使用ASCII字符,但它不是纯文本格式。 – dreamlax 2012-01-15 19:15:29

回答

0

TeX文件需要完全解释,才能可靠地提取任何类型的文本。在C#中编写一个完整的TeX解释器可能是一项真正的任务,所以我建议使用现有的解释器来输出可以更容易解析的格式,例如HTML。

你可能会觉得倾向于写一个正则表达式来简单地去掉所有的\command,但是这不会给你一个非常准确的结果,因为有些命令产生自己的文本,并且[不太常见]一些命令捕获文本跟随它。此外,您将遇到字符更改类别代码的问题,某些字符可能处于活动类别代码中,这意味着字符本身可能是命令。