我上一个项目,我需要阅读一些普通的文本工作......我要找任何API通过我可以读取普通的文本,也可以将其转换为.csv文件...... 可在任何一个PLZ帮助... Windows OS上使用的Java ...通用文本阅读
--------------------------更多细节--- -------------------------------------------------- ---------------------------------- 让我澄清:
假设我有一个PDF文档或对于这个问题任何文件类型的文件。我打算使用“打印到通用文本打印机”选项并以该格式获取文件。最后,我打算使用一些API,它们使我能够以编程方式读取此通用文本格式文件。我打算从这个通用文本文件中提取文本。
所以,无论是任何文件(.DOC/.PDF/.xls的等wtatever),我打算使用打印选项来创建一个通用的文本格式文件。然后运行我的代码来阅读这些文件并提取一些信息。
PS:假设我有一个带有标准字段的状态报告表。好。但是,有些人可能会用.pdf提交,有些用.doc提交,有些用文本格式提交。但是,每个文档都包含相同的字段,但可能具有不同的布局。现在
,我要寻找一个通用的解决方案,由我shoudl能够每个文件类型转换到通用文本文件格式,然后应用一些逻辑来提取我的状态报告域。
语言,架构,操作系统请。 – Bobby 2009-11-27 12:29:35