2010-04-12 119 views
3

志愿者工作要求我们将大量LaTeX文档转换为ePub文件格式。这是一系列开源小说书籍,迄今为止只有通过按需印刷服务才能在纸上制作。我们希望能够为需要ePub格式的图书阅读器设备(例如Kindle)的用户提供图书以获得最佳效果。是否有Python的标准词法分析器/解析器工具?

幸运的是,ePub是一个非常简单的格式,但是LaTeX并不需要生成所需的XHTML输出。

我们尝试过使用替代的LaTeX编译器(例如plastex),但最终我们认为只需编写我们自己的编译器,它可以理解LaTeX语言的一小部分,并直接编译为XHTML/ePub 。

以前我在Windows上使用过一个名为GOLD的工具。这使我可以直接从BNF语法转到存根分析器。它也让我用我喜欢的任何语言来实现解析器。 (我会选择Python)。

这个产品必须在Linux上工作,所以我想知道是否有一个等效的工具链在Ubutnu/Eclipse/Python下工作。我们的想法是,我们将采用TeX的语法并仅实现其中的一小部分,但我们不希望花费大量时间来担心语法和语法分析。解析器生成器显然会为我们节省大量时间。

萨尔


UPDATE 1:奖金标记用于与出色的文件或教程的溶液。


更新2:额外的奖金,如果没有为TeX已经存在的语法文件,因为所有我必须做的就是实现我们关心的功能。

+0

问题要求我们推荐或找到工具,图书馆或最喜爱的非现场资源,因为他们倾向于吸引自以为是的答案和垃圾邮件,所以不适合堆栈溢出。相反,请描述问题以及到目前为止解决问题所做的工作。 – 2014-03-25 00:24:20

回答

3

我曾经使用tex4ht将LaTeX转换为XHTML + MathML。工作很好。从此,您可以使用输出HTML作为ePub的基础。

当然,这打破了Python的工具链,因此它可能不会成为你喜欢的方法......

+0

这不是问题。我们有Python和Tex人员组成的团队。唯一的问题是我们想要建立稳定的工具。 – 2010-04-12 13:02:18