2009-04-21 49 views
1

Informatica如何处理非结构化数据源(如PDF)?如果表格报告以PDF形式存储,我们可以将它从PDF中读出为表格数据(如.NET中的数据表)吗?PDF Informatica中的数据源

回答

0

PDF内部实际上是非常结构化的。最近对PDF规范的修订可能会提供一种方法来为外部处理准备好数据,但PDF文档的主要目标是描述要打印的文档,因此各种环境和设备都可以打印文档,其结果为尽可能相似。

它主要取决于PDF的创建者,如果提供了任何额外的数据,而不是在何处打印文本和行以形成表格。

2

的Informatica的PowerCenter非结构化数据选项

滑稽你提到它,我曾经发明了底层技术的初创公司工作,直到Informatica收购。

相关问题