2009-08-19 56 views
0

我真的需要使用WordPerfect 12文件中包含的信息,而不使用WordPerfect的缓慢的可视化界面,但我找不到有关文件格式或用于读取/写入文件的任何Python模块的详细文档。我在网上发现了一篇文章,似乎解释了如何将WordPerfect转换为文本,但我对它的工作原理并不了解。用Python读取WordPerfect文件?

http://mail.python.org/pipermail/python-list/2000-February/023093.html

如何做到这一点?

回答

1

好的,这是我做的。我以二进制模式读取文件,将数据转换为十六进制值的字符串表示形式,并使用非官方的WordPerfect文档创建正则表达式来替换表示非文本格式代码和元数据的所有十六进制字符串,然后转换所有内容回到文本。

一块肮脏的黑客,但它完成了工作。

+0

拉姆接受我自己的答案,我知道。 – twneale 2009-09-17 03:01:55

+1

你会介意在这里发布你的工作解决方案样本吗? – Stealth 2012-10-24 13:21:43

+0

[WP_Reader](https://github.com/gaudulli/WP_Reader)是一个C#库,它更进一步,并根据WP规范模拟整个文档。它只是完成了一半,但它适用于WP中的大多数“标准”格式化功能。比OP晚六年,但终于有一些东西可以用来打开它称为文档的WordPerfect幻数的钝角结构。 – 2016-02-20 17:11:37

3

你的链接的相关部分是这样的:

os.system("%s %s %s" % (WPD_TO_TEXT_CMD, "/tmp/tmpfile", "/tmp/tmpfile.txt")) 

这是做一个系统调用一个名为“wp2txt”外部程序。谷歌搜索该计划产生积极的命中。

+0

主动命中主要是维基百科转储文件的文本,我想你想:http://alter.org.ua/en/soft/win/convert/ – Tristan 2009-09-12 18:45:26