2016-08-15 84 views

回答

8

数据来源是所有关于理解数据的来源和归属。在典型的系统中,你会得到'日志'。当你考虑数据流经一系列进程和队列时,最终会有很多课程。如果你想要遵循某条数据所采用的路径,或者需要多长时间才能走上这条路,或者发生了什么事情,将对象分解成不同的对象等等,所有这些都是非常耗时和困难的。 NiFi支持的出处就像登录类固醇,并且全都是关于保持和追踪数据与事件之间的这些关系,这些关系塑造并影响了发生的事情。 NiFi正在跟踪每条数据的来源,它对数据的了解,在分裂,连接,转换,发送数据的位置以及最终丢弃数据时保持不变。把它想象成一个数据监管链。

这真的很有价值,原因有几个。首先,了解和调试。拥有这个源头可以捕获来自给定的手段,甚至可以在流程中向前或向后查看数据来源和去向。鉴于NiFi在封面下还有一个不可变版本的内容存储,您还可以使用它直接点击流程每个阶段的内容。您也可以根据最新流程重播给定事件的内容和上下文。这反过来意味着更快地迭代到您想要的配置和结果。出于合规性原因,此出处模型也很有价值。您可以证明您是否将数据发送到了正确的系统。如果你知道你没有那么可以解决问题的数据或创建一个强大的审计跟踪跟踪。

Apache NiFi的出处模型非常强大,它也被扩展到Apache MiFi的子项目Apache MiNiFi。产生更多出处的更多系统将意味着你有更强大的跟踪端到端数据的能力。当它可以与其他血统系统或集中式血统商店结合时,它变得更加强大。 Apache Atlas可能是一个很好的系统,可以集成这个系统来集中视图。 NiFi不仅能够做到我上面描述的内容,还能将这些活动发送到这样的中央商店。所以,今后会有令人兴奋的时刻。

希望有所帮助。

+0

这是非常有用的/ –