如何为apache drill编写自定义存储插件

我以合适的格式提供我的数据，Apache drill无法支持这些数据。有没有关于如何编写我自己的存储插件来处理这些数据的教程。如何为apache drill编写自定义存储插件

2016-05-31 sushil

它是某种RDBMS吗？如果是的话，你可以定义你的插件。如果这是别的，你必须为该插件编写代码。 –

尽管它不是一个RDBMS，但我们确实有支持SQL的工具，如在该数据集之上的语言。 – sushil

这是真的应该在文档中，但目前不是。界面不是太复杂，但是查看一个现有的插件并理解正在发生的一切可能有点多。

编写存储插件有两个主要组件，将信息公开给查询规划器和模式管理系统，然后实际实现从数据源API到钻取记录表示的转换。

最近添加了Kudu插件，它是一个合理的存储系统模型，可以充分利用Drill的许多元素。我要指出的一件事是，如果你的存储系统没有被分配，并且你打算做所有的远程读取，你不必在组扫描中做很多的工作/工作列表/分配工作。如果我有一段时间了，我会尝试在界面的不同部分写一篇文档，也许会写一篇关于现有插件的教程。

https://github.com/apache/drill/tree/master/contrib/storage-kudu/src/main/java/org/apache/drill/exec/store/kudu

来源

2016-06-05 20:25:10 jaltekruse

这是我正在寻找的确切信息。我确实经历了Hiva存储插件，发现它太复杂了。我有一个后续问题。实际编写插件/模块以在最终工作者节点上执行实际查询的工作量有多少。我的意思不是只是阅读和提供记录，我想要采取演习执行计划并执行它。 – sushil

@jaltekruse，我想要构建一个存储插件，并希望有关此任何教程。有关于文件的消息吗？ –

那么你有没有时间写教程？ :) –

如何为apache drill编写自定义存储插件

回答

相关问题