0
我看到火花AVRO数据源是基于FileFormat接口实现的。 有没有关于如何写基于FileFormat的火花自定义数据源的任何文档?到目前为止,我找不到任何东西(除了spark avro的源代码)。如何写火花自定义数据源基于FileFormat
谢谢!
我看到火花AVRO数据源是基于FileFormat接口实现的。 有没有关于如何写基于FileFormat的火花自定义数据源的任何文档?到目前为止,我找不到任何东西(除了spark avro的源代码)。如何写火花自定义数据源基于FileFormat
谢谢!
下面是一个简单的基于文件的数据源火花的一个例子:https://hackernoon.com/extending-our-spark-sql-query-engine-5f4a088de986
下面是实现数据源API几个例子,以及: * https://github.com/databricks/spark-csv * https://github.com/databricks/spark-avro