Informatica如何处理非结构化数据源(如PDF)?如果表格报告以PDF形式存储,我们可以将它从PDF中读出为表格数据(如.NET中的数据表)吗?PDF Informatica中的数据源
1
A
回答
0
PDF内部实际上是非常结构化的。最近对PDF规范的修订可能会提供一种方法来为外部处理准备好数据,但PDF文档的主要目标是描述要打印的文档,因此各种环境和设备都可以打印文档,其结果为尽可能相似。
它主要取决于PDF的创建者,如果提供了任何额外的数据,而不是在何处打印文本和行以形成表格。
2
0
您必须使用处理非结构化数据的Informatica B2B数据交换产品。该产品提供了处理各种非结构化数据的功能,不仅包括PDF,还包括Word,Excel,Star Office,AFP,PostScript,PCL和HTML。您将不得不使用Informatica B2B数据转换。
这里是快速链接供您参考。
http://www.informatica.com/us/products/b2b-data-exchange/b2b-data-transformation/
相关问题
- 1. Informatica powerexchange来源
- 2. Informatica的“治疗源行为”
- 3. informatica中的数据类型格式
- 4. informatica中的查找源过滤器
- 5. Informatica B2B数据交换
- 6. Informatica 8.6.0与Netezza数据库
- 7. 在informatica中捕获数据错误
- 8. Informatica的数据类型转换
- 9. 使用数据源创建PDF
- 10. 使用informatica在Teradata TPT流中进行数据清理使用informatica
- 11. 如何在导入表中重命名ODBC数据源 - >在informatica中连接到数据库?
- 12. Informatica Powercenter数据截断/溢出错误
- 13. informatica datetime数据类型格式
- 14. informatica实时数据映射(LDM)安装
- 15. INFORMATICA源限定符SQL查询
- 16. Informatica的:从两个表中合并数据,消除重复
- 17. Informatica PowerCenter Designer中等效的SSIS数据查看器
- 18. Informatica中支持的Microsoft Azure SQL数据仓库
- 19. 使用数据库表中的数据可以触发Informatica工作流程吗?
- 20. 我如何从Informatica存储库中的数据库源文件夹中恢复已删除的表格
- 21. 如何从Informatica中的Excel源过滤掉空行?
- 22. 如何导入informatica中的源文件结构?
- 23. 在数据连接中,数据源中没有Mysql数据源
- 24. informatica中的数字数据类型将数字转换为指数形式
- 25. 读取源文件名时出错以informatica中的数字开头
- 26. 逗号在Informatica中
- 27. Informatica的Reg_replace
- 28. Informatica的问题
- 29. 仅在表中更新数据时重建Informatica永久缓存
- 30. MySQL数据库中的数据源