2011-10-02 52 views
1

我正在寻找允许将快速(简单)数据导入现有数据库表的工具/库。例如,phpmyadmin允许从.csv,.xml等数据导入。通过Beesvax for Hive在Hadoop色调中,我们可以从文件创建表。我正在寻找可以与postgresql或库一起使用的工具,它们可以快速轻松地完成这些工作 - 我正在寻找避免从读取文件到通过jdbc插入到db的手动编码的方法。快速简单的数据导入工具/库

回答

1

可以在PostgreSQL中使用标准工具完成所有工作,无需额外的库。

对于.csv文件,您可以使用内置的COPY命令。 COPY快速而简单。源文件必须与数据库位于同一台机器上。如果没有,您可以使用psql的非常相似的\ copy元命令。

对于.xml文件(或任何真正的格式),您可以使用pg_read_file()内建的plpgsql function。但是,我引述:

只能访问数据库集群目录和log_directory 内的文件。

所以你必须把你的源文件放在那里或创建一个符号链接到你的实际文件/目录。然后你可以用unnest()xpath() and friends来解析它。你至少需要PostgreSQL 8.4。

解析此blog post by Scott Bailey中的XML的开始。

+0

@mich:我在另一个问题上发布了[用于XML导入和解析的示例函数](http://stackoverflow.com/questions/7491479/xml-data-to-database/7628453#7628453)。可能对你有用。 –