2016-05-31 154 views
3

我以合适的格式提供我的数据,Apache drill无法支持这些数据。 有没有关于如何编写我自己的存储插件来处理这些数据的教程。如何为apache drill编写自定义存储插件

+1

它是某种RDBMS吗?如果是的话,你可以定义你的插件。如果这是别的,你必须为该插件编写代码。 –

+0

尽管它不是一个RDBMS,但我们确实有支持SQL的工具,如在该数据集之上的语言。 – sushil

回答

10

这是真的应该在文档中,但目前不是。界面不是太复杂,但是查看一个现有的插件并理解正在发生的一切可能有点多。

编写存储插件有两个主要组件,将信息公开给查询规划器和模式管理系统,然后实际实现从数据源API到钻取记录表示的转换。

最近添加了Kudu插件,它是一个合理的存储系统模型,可以充分利用Drill的许多元素。我要指出的一件事是,如果你的存储系统没有被分配,并且你打算做所有的远程读取,你不必在组扫描中做很多的工作/工作列表/分配工作。如果我有一段时间了,我会尝试在界面的不同部分写一篇文档,也许会写一篇关于现有插件的教程。

https://github.com/apache/drill/tree/master/contrib/storage-kudu/src/main/java/org/apache/drill/exec/store/kudu

+0

这是我正在寻找的确切信息。我确实经历了Hiva存储插件,发现它太复杂了。 我有一个后续问题。实际编写插件/模块以在最终工作者节点上执行实际查询的工作量有多少。我的意思不是只是阅读和提供记录,我想要采取演习执行计划并执行它。 – sushil

+0

@jaltekruse,我想要构建一个存储插件,并希望有关此任何教程。有关于文件的消息吗? –

+2

那么你有没有时间写教程? :) –

相关问题