amazon-redshift

    0热度

    1回答

    obj = boto.redshift.layer1.RedshiftConnection() obj.create_cluster( cluster_identifier='bototest', node_type='dw.hsl.xlarge', master_username='suresh', master_user_password='Suresh

    0热度

    1回答

    我有这个查询,我试图获得基于给定的过滤器的记录总数并尝试在单个查询中获取分页所需的有限数量的数据。 早些时候,我在两个步骤做这其中i计算出的第一款基于 Optimising Select number of rows in PostgreSql for multiple group by fields 记录数,然后根据页面大小有不同的查询所需的行数和偏移需要 EXPLAIN select coun

    0热度

    1回答

    我们在AWS上托管了vertica,并且该数据库的总大小为500GB。 那么将数据从vertica迁移到redshift最快的方法是什么? 一个方法将是 1.出口Vertica的数据至S3 2.负载从S3的数据红移。 有没有更好的方法?

    1热度

    1回答

    我实际上正在尝试使Rails与RedShift一起工作,并面临Rails默认索引的一些问题。我的工作基于repo activerecord-redshift-adapter。 默认情况下,Rails使用SERIAL类型来创建他的主键。不幸的是,这是RedShift没有报告的。所以我实际上试图找到这种SERIAL类型的替代方案,然后在找到可行的解决方案后再分叉回购。我正在考虑一个BIGINT,从什么

    0热度

    1回答

    我有我的红移的SQL Server数据,如: MatchId TeamId Teamname Home/away Teamstats statsvalue 1 101 a home yards 0 1 101 a home firstdown 1 1 101 a home points 2 1 101 a home completion

    1热度

    1回答

    我在Perl中通过DBI和DBD::Pg模块访问AWS RedShift,并且我在SQL绑定变量中遇到了一些问题。我首先用sql语句调用准备(?代替变量),然后我调用需要映射到?的变量数组执行,但它不起作用。它只是吐出“语法错误”。 我的理解是,这个绑定变量需要驱动程序和数据库本身的支持,所以我不确定它是否是驱动程序或RedShift的问题,但后来我不确定我的理解(绑定变量支持取决于驱动程序和底层

    1热度

    2回答

    我看了一下“describe_cluster_snapshots”从去年的解释快照... http://docs.pythonboto.org/en/latest/ref/redshift.html#boto.redshift.layer1.RedshiftConnection.create_cluster 它有一个选项START_TIME和END_TIME,但也没有办法对它进行排序。如何使用bo

    7热度

    1回答

    是否可以通过java jdbc连接从S3到Redshift激发复制命令? 实施例: 拷贝从 'S3://' 测试CREDENTIALS 'aws_access_key_id = XXXXXXX; aws_secret_access_key = XXXXXXXXX'

    6热度

    4回答

    我们对Amazon RedShift中的大型数据集进行了一些聚合,并且我们在MySQL中有一些相对较少的数据。对于RedShift中的一些连接,我们需要MySQL中的数据。将MySql数据同步到RedShift的最佳方式是什么?像oracle中的远程视图那样在红移中有这样的事情吗?或者我应该编程查询MySql并在RedShift中插入/更新?

    5热度

    1回答

    有效地(即二分查找)Redshift是否在A列上查找条件为A =的查询时在列A上排序的表的块? 作为一个例子,假设有一个表T,其中有约500m行,约50个字段,在字段A上分布和排序。字段A具有很高的基数 - 因此有大约4.5m不同的A值,具有完全相同的T中的行数:每个值约100行。 假设有一个XL节点的红移群集。 字段A未压缩。正如ANALYZE COMPRESSION所建议的,所有其他字段都有一