我试图遍历Word文档并保存Word文档中找到的所有图像。我尝试了样品word文档上传到online demo,发现图像被列为:如何在DOCX4J中保存Word文档中的图像
/word/media/image1.png rId5 image/png
/word/media/image2.png rId5 image/png
/word/media/image3.jpg rId5 image/jpeg
在遍历文件我如何编程方式保存这些照片?
目前我得到的所有从文档中的文字是这样的:
WordprocessingMLPackage wordMLPackage = WordprocessingMLPackage.load(new java.io.File(filePath))
MainDocumentPart documentPart = wordMLPackage.getMainDocumentPart()
Document wmlDocumentEl = (org.docx4j.wml.Document)documentPart.getJaxbElement()
Body body = wmlDocumentEl.getBody();
DocumentTraverser traverser = new DocumentTraverser();
class DocumentTraverser extends TraversalUtil.CallbackImpl {
@Override
public List<Object> apply(Object o) {
if (o instanceof org.docx4j.wml.Text) {
....
}
return null;
}
}
您关心图像的上下文(即顺序,周围文本)还是只想转储他们在哪里? – JasonPlutext 2014-10-28 00:14:45
虽然这将是以后的良好信息......现在只需倾销它们就足够了。 – birdy 2014-10-28 02:35:48
只需点击此链接(http://cnedelcu.blogspot.in/2013/02/top-3-ways-to-extract-images-from-word-docx-doc-document.html)可能对您有用 – yugi 2014-10-30 04:27:20