2010-07-07 78 views
2

目前我有一个带有注释的word文档。文档的结构在注释中指定。该文件包含嵌入的图像。在C#中读取MS word文件带注释

现在我需要在结构上根据注释读取文档并创建一个html文件。 问题是我不能捕获目前的嵌入式图像信息。

 Comments comments = doc.Comments; 
     foreach (Comment comment in comments) 
     { 
      String text = comment.Range.Text; 
      String actualText = comment.Scope.Text; 

     } 

有人可以帮助捕获嵌入的图像。 另外我需要文档的确切“html”格式。目前文本显示为纯文本而没有任何段落信息。

回答

3

在.NET应用程序[CodeProject上]集成的Microsoft Word http://www.codeproject.com/KB/office/WordInDotnet.aspx

这可以帮助你。刚才您检查了API方法。我相信API中已经有方法列出所有文件,我认为你可以通过编程来选择HTML查看方法,然后保存它。希望有所帮助。玩的开心。

+0

感谢您的意见。 我可以使用CopyImage和ClipBoard功能来获取图像细节。 comment.Scope.CopyImage(); String completeData = Clipboard.GetData(DataFormats.html).ToString(); 此html内容包含临时位置磁盘上“本地映像文件”的路径。 另外comment.Scope.get_XML(false)将“xml”中的完整内容与图像数据一起作为“bindata”。 – 2010-07-07 18:34:30