impala

0热度

1回答

我有一个1,700行查询要在Impala-shell中执行。我创建了一个shell脚本如下命令： impala-shell -V -i hostname -q "[QUERY]" 然而，当我使用sh script.sh执行它，我得到了错误消息"Argument list too long"。我能够使用Impala-shell命令运行更简单/短的查询。我也尝试通过运行命令ulimit -s 655

0热度

2回答

如何选择下一列时，前一列满足使用SQL

我使用SQL对帕拉一定的条件，我查询的表格看起来像客户名称shop1 shop1number SHOP2 shop2number shop3 shop3number TOM AB 111 AA 231 321 AC AMY AC 121 AB 213 AD 231 弗兰克AD AE 123 233 234 AB enter image description here 这里，数字是客户忠诚度数

1热度

1回答

Hadoop的帕拉：格式数据类型整数日期/时间戳记使用更新时间函数

我在因帕拉工作如下表所示： customer_id | day_id | return_day_id ABC 20170830 20170923 BCD 20170830 20170901 不幸的是，无论是day_id & return_day_id字段INT而不是日期。如何将其数据类型更改为日期，以便我可以在day_id后的4天内使用return_day_id来计算不同的cus

0热度

1回答

将字符串转换为Hive中的时间戳

我有一个值'2017-09-27T19：25：15.927-07：00'，有什么办法将它转换为时间戳吗？我使用Hive 1.1.0。 select unix_timestamp("2017-09-27T19:25:15.927-07:00", "yyyy-MM-ddTHH:mm:ss.SSSX")但它trows Bad date/time conversion format select uni

1热度

3回答

处理的黑斑羚

空数据我想了解我使用下表 ╔════╦══════════════╦══════════╗ ║ id ║ name ║ salary ║ ╠════╬══════════════╬══════════╣ ║ 1 ║ cde ║ 5636 ║ ║ 2 ║ asd ║ 148 ║ ║ 3 ║ pwe ║ null ║ ║ 4 ║ lmn ║ 959 ║ ╚═══

0热度

1回答

Impala：AnalysisException：LEFT OUTER JOIN需要ON或USING子句

我有一个基于存储视频查看记录的Parquet文件的Impala表。结构是： VideoSession ... ... accountdata struct < ... ... emailid string ... ... > ... playbacksegments <

0热度

1回答

我应该在连接条件还是先前的CTE中放置行号过滤器？

我有一个subscription表和一个payments表，我需要加入。我试图在2个选项之间做出决定，性能是一个关键考虑因素。以下两个选项中哪一个表现更好？我正在使用Impala，并且这些表很大（数百万行）我只需要为每个id和date分组（因此为row_number()分析函数）获得一行。我已经缩短了的查询来说明我的问题： OPTION 1： WITH cte AS (

2热度

1回答

Impala ODBC/JDBC性能不佳 - 与NN相比，远程服务器的行提取速度很慢

在CDH的NameNode中，当我通过odbc脚本（php/perl或python）运行查询时，我可以获取所有结果（9.2M）在一个变量中大约30秒，但是当我用相同的脚本/查询试图另一个远程2级的服务器上时，执行时间是在第一服务器28分钟和在第二17分钟。要排除的假设，这是一个网络速度问题，我获取结果上的一个文件，然后我跟scp命令复制到第一个远程服务器，并完成了〜40秒。我在查询信息观察什么

0热度

1回答

Hadoop初学者 - 数据提取和分析

HDFS存储结构化的&非结构化数据。热线& IMPALA使我们能够编写SQL查询，然后将其转换为MapReduce。用户如何了解存储数据的模式或者如何根据存储的数据形成这些表格？

0热度

1回答

impala是否支持数据库游标？

我试图实现服务器端分页。数据库光标看起来像是一个很好的方法。 Impala是否支持像关系数据库那样的database cursors？该文件没有明确提及它是否存在。