2012-07-30 117 views
1

我正在研究一个应用程序,我需要将.docx和.pdf文件转换为基本格式的.txt 文件。我在网上搜索它,但无法找到任何免费的第三方DLL。任何人都可以为我提供最好的方式和一些dll参考。如何将.docx和.pdf转换为.txt文件

由于提前

回答

1

http://support.microsoft.com/kb/316383描述你想要做的.docx文件非常清楚。 http://visualbasic.about.com/od/quicktips/qt/disppdf.htm描述相同,但与.pdf文件。

将文件读入代码后,使用VB.NET内置的文件写入功能输出到txt文件。

+0

感谢您的回复。但是我已经有了一个docx文件列表。如何在oDoc对象中加载这些文件 – 2012-07-31 07:03:35

+0

oDoc = oWord.Documents.Add(“C:\ Temp \ WordTest.docx”) – 2012-07-31 13:14:46

0

下面的代码将为您处理工作。这是我为大老板写的哈哈。我希望它有帮助。代码将工作表中的第一个单元格读取为docx文件所在的文件夹,然后将它们逐个转换为txt文件,并将其保存在同一个文件夹中。

Const wdFormatText = 2 

If Not Len(Cells(1, "A").Value) > 0 Or Dir(Cells(1, "A").Value, vbDirectory) = "" Then 
    MsgBox ("Invalid Folder") 
    Exit Sub 
End If 

Dim StrFile As String 

    StrFile = Dir(Cells(1, "A").Value & "\*.docx") 
    Do While Len(StrFile) > 0 
     Set objWord = CreateObject("Word.Application") 
     Set objDoc = objWord.Documents.Open(Cells(1, "A").Value & "\" & StrFile, False, True) 
     objDoc.SaveAs Cells(1, "A").Value & "\" & StrFile & ".txt", wdFormatText 
     objWord.Quit 
     StrFile = Dir 
    Loop