我想按照它们写入Word文档的顺序来处理对象。我遇到的对象是段落,段落中的文字,段落中运行的文本,表格单元格中的表格和段落。到目前为止,我有两个有用的程序。 通过文件段落并获得该段文本的文件;存储在由[段落号]索引的列表中。同样的程序能够从运行中收集文本;存储在由[段落#] [运行#]索引的2D列表中,但是我没有发现运行比段落的整个文本更有用。 我的第二个程序遍历整个文档并找到表格。当它有一个表格时,它会逐行浏览单元格中的行,单元格和段落。在docx中按顺序处理对象
现在,这些看起来像是我的目标的伟大构建块。我想按顺序收集文字。抽象地说,就好像闪烁的文本光标被一个人按住键盘上的右箭头命令移动一样。当文本光标在对象上移动时,它将通过标记对象的#号和对象类型的多个索引来存储它们。
说我有子函数paragraph_read和table_read。说文档有这个顺序的对象:。我想通过这些和执行我的子功能,以这个顺序:paragraph_read,paragraph_read,table_read,paragraph_read
我想知道我的程序是否可以通过像光标滑动右对象的文档对象移动。
帮助很大程度上appreaciated。谢谢。
克里斯
有一些讨论,并在此代码,描述那个:https://github.com/python-openxml/python-docx/issues/40。请务必在最后进行一些更新以适应最新版本。 – scanny
这正是我想要做的。感谢指针。 -Chris – Chris
@scanny我无法理解此页面上的代码。你能说说我吗?或者给我一些关于如何使用它的提示? – Chris