2014-10-17 59 views
0

我正在使用Python建立与greenplum的连接并自动运行代码。为此,我使用这些驱动程序psycopg2,psycopg2.extensions & psycopg2.extras。我还必须建立与Teradata的连接并运行一些代码并将Teradata中的表格传输到greenplum。有人可以请建议一些驱动程序或方法来做到这一点?我听说可以在python中使用数组或alteryx来做到这一点,但我什么也没有。如何使用Python将数据从Teradata传输到Greenplum?

+0

是否可以使用ODBC连接驱动程序?谷歌表示他们存在于Greenplumb。如果您可以为这两个数据库使用ODBC驱动程序,则可以使用pyodbc执行SQL。下面是使用pyodbc http://stackoverflow.com/a/26727920/2573907非常简单的看一下ODBC数据移动。 (你不会想要使用易变的表格)。 – DrBailey 2014-11-04 05:13:10

回答

1

我猜数据量至少是中等大小 - 数百万或更多。

  1. FastExport或Teradata Parallel Transport将Teradata数据导出到 平面文件或命名管道。
  2. 使用Greenplum的首选方法进行摄取使用批量文件 从平面文件或命名管道加载数据。

其他选项可能包括使用Python通过JDBC调用Teradata FastExport API,但是您仍然需要弄清楚如何通过Greenplum高效地获取数据。