amazon-athena

    1热度

    1回答

    我试图使用这个DDL在亚马逊的雅典娜创建一个表,但是在查询后,我看到我的所有日​​期值(在transactiondate字段中)都是NULL。源数据格式仅为mm/dd/yyyy,即08/01/2017。 任何想法? CREATE EXTERNAL TABLE wf2( transactiondate日期, amount十进制(10,0), description串, filename字符串)日期的

    1热度

    1回答

    我这里有 Joe, 30, Male, 3 Winston, 40, Male, 7 Emily, 18, Female, 5 Wendy, 32, Female, 4 一个简单的CSV文件,我上传到AWS的S3桶。然后,使用雅典娜,我创建了一个表 正确的S3存储路径 格式为* .csv数据formt 列,name string, age int, gender string, cons

    2热度

    2回答

    我试图创建CSV文件的外部表与AWS雅典娜与下面的代码,但该行TBLPROPERTIES ("skip.header.line.count"="1")不起作用:它不会跳过第一行(头)的csv文件。 CREATE EXTERNAL TABLE mytable ( colA string, colB int ) ROW FORMAT SERDE 'org.apache.had

    0热度

    1回答

    我在AWS上的雅典娜数据库上有一个很大的数据集。我想从它并行读取,我习惯了foreach包的方法来从分叉内R. 我使用RJDBC 这里就是我想: out <- foreach(i = 1:length(fipsvec), .combine = rbind, .errorhandling = "remove") %dopar% { coni <- dbConnect(driver, "jd

    1热度

    1回答

    从文档AWS::Athena::NamedQuery,不清楚如何将雅典娜附加到同一个堆栈中指定的S3存储桶。 如果我不得不从example猜,我会想象,你可以写像一个模板, Resources: MyS3Bucket: Type: AWS::S3::Bucket ... other params ... AthenaNamedQuery: Ty

    0热度

    2回答

    该表具有这样的列, data MAP<string, string> 和行等, id | data 1 | {"foo": 123} 2 | {"bar": 456} 然后,如何搜索数据[ “酒吧”] = 456? 我试过了,但它显示错误“列”栏无法解析“

    0热度

    1回答

    我将管道分隔的未分区数据作为Amazon S3上的文本文件,我从红移卸载以清除我们的红移节点上的空间。我在雅典娜创建了一个表来访问这些数据,但我想优化我的数据以获得性能。我尝试使用AWS EMR将我的数据转换为parquet格式,并将它们作为parquet格式的文件存储在s3存储桶中。我试图按照AWS网站上的说明操作,但我发现这些说明有点令人困惑。

    1热度

    1回答

    我正在使用Amazon Athena通过存储在S3存储桶中的一些日志文件进行查询,并且正在使用分区来为我需要查询的文件分割一年中的几天。我想知道 - 因为我有很多天要添加到我的表格中,我可以在一个ALTER TABLE命令中完成所有这些操作,还是需要使用与我想要创建的分区数量一样多的ALTER TABLE命令? 这是我使用的那一刻命令的例子: ALTER TABLE logfiles

    1热度

    2回答

    我有一个管道分隔的文本文件,它是360GB压缩文件(gzip)。 它有超过1,620列。我不能准确显示字段名,但这里是它基本上是什么: primary_key|property1_name|property1_value|property800_name|property800_value 12345|is_male|1|is_college_educated|1 严重的是,有超过这些属性名

    0热度

    2回答

    我正在使用Athena从S3上分区的多个文件中查询数据。我创建了一个 CREATE EXTERNAL TABLE IF NOT EXISTS testing_table ( EventTime string, IpAddress string, Publisher string, Segmentname string, PlayDuration do