我有一个非常长和复杂的单词文档(200多页),并且想要提取所有使用某种样式格式化的内容,同时跳过文档的其余部分。只要你只需要找到一种风格就很容易 - 但我正在寻找一种可以提取各种风格(即所有标题和所有格式为style2的文本)的解决方案。如何从word文档中提取使用特定样式格式的文本?
2
A
回答
1
如果您可以设法将所有测试复制到另一个文档,然后运行这个很好,但这是一个很好的开始 - 这是如何循环并删除所有不是您想要保留的样式的所有内容。
你可以做一些if语句,而不是检查每个样式,但是使用所有OK样式的字符串并使用instr是很好的。
Sub DeleteUnwatedFormats()
Dim para As Paragraph
Dim okStyles As String
okStyles = "Normal, Heading1, Heading2" 'list up ok styles
For Each para In ActiveDocument.Paragraphs
If InStr(1, okStyles, para.Style) = 0 Then
para.Range.Delete
End If
Next
End Sub
0
我试图运行上面给出的代码,但它删除了一切 - 我认为在行:
If InStr(1, okStyles, para.Style) = 0 Then
okStyles和para.Style周围应换给:
If InStr(1, para.Style, okStyles,) = 0 Then
当我这样做,它工作得很好。
相关问题
- 1. 如何使用VBA从MS-Word文档中提取特定表?
- 2. 如何使用Novacode.Docx从现有Word文档中获取样式?
- 3. 如何使用Apache POI提取word文档的格式信息?
- 4. 提取特定格式的文本-perl
- 5. 如何从大型Word文档中提取特定URL
- 6. 如何从特定的二进制文件格式中提取文本?
- 7. 如何从样式表类中提取特定样式HTML
- 8. 使用Python从word文档中提取图像和文本
- 9. 如何从Word文档中提取RTF/HTML文本?
- 10. 使用c#interop从word文档获取格式
- 11. 如何写word文档(特定格式)从C#Windows窗体应用程序
- 12. C#Word文档 - 如何清除格式?
- 13. 如何从使用C#的Word文件中提取文本?
- 14. 如何在excel中导入word文档保持相同的格式样式?
- 15. 如何使用javascript从文本区域提取文本的样式,包括值?
- 16. 如何使用JavaScript从Word文档中提取图像?
- 17. 如何使用Apache POI从MS Word文档的文本框中获取文本?
- 18. rmarkdown word文档中的HTML格式表
- 19. 从Word文档中提取宏到c#文本文件#
- 20. 使用jQuery从特定的文本中提取文本
- 21. 如何使用mongoexport获取.csv文件中的特定格式?
- 22. 使用Matlab将word文档的样式复制到另一个文档中
- 23. 用于从文本文件中提取特定模式信息的脚本
- 24. 在Word文档中更新并应用自定义样式
- 25. 从样式中定义的文本块中获取文本
- 26. 如何使用代码将表格样式分配给一个word文档
- 27. 从Word文档的所有空格中删除格式
- 28. 合并VB文档中保存格式的word文档
- 29. 从Ruby on Rails中获取各种文档格式的文本
- 30. 如何在特定的矩形区域内从pdf文档中提取文本?
就像+1 :)一样简单:) – JMax