prestodb

    0热度

    1回答

    我试图运行类似下面的查询命令: SELECT * FROM foo WHERE cardinality(bar) > 0 AND bar[1] = '...'; 但是,我越来越Query failed: Array subscript out of bounds。我假设这是因为Presto试图在检查cardinality(bar) > 0之前通过检查bar[1] = '...'来优化查询。有没

    0热度

    2回答

    我正在评估大型数据(〜100GB)上的分析查询引擎(交互式以及批处理)的分析查询。其中一个要求是低延迟(< = 1秒)的计数不同的查询,其中近似的结果(高达5%的错误)是可以接受的。 PrestoDB似乎支持这与它的approx_distinct()。据我的理解,它使用HyperLogLog。但是,除非数据以累计形式保存,并且HyperLogLog值必须在运行时进行计算。对于大型数据集,我不认为我

    0热度

    2回答

    我正在对presto上的tpch 100gb数据集执行一些查询,我有4个节点,1个主节点,3个工作负载。当我尝试运行一些查询时,并非所有查询都在Presto Web界面上看到节点在执行期间死亡,导致查询失败,错误如下: .facebook.presto.operator .PageTransportTimeoutException:遇到与工作节点交谈的错误太多。该节点可能已经崩溃或负载过重。这可能

    0热度

    1回答

    我正在尝试搜索具有数据类型映射(varchar,varchar)的列。现在访问该列的一种方法是使用此结构name_of_column [''键'],它将为该键提供值。但我想知道什么是可能的键,然后应用组和其他操作基于那些键。 我试过在互联网上搜索,但无法找到合适的解决方案。

    2热度

    1回答

    我想在AWS Athena上运行LIMIT和OFFSET子句的查询。我以前支持,而the latter is not。有没有使用其他方法来模拟此功能的方法?

    1热度

    1回答

    有没有一种方法可以验证具有集群概述的Web界面,以便不是每个人都可以看到正在运行的查询,并且只有系统的管理员才能访问它。

    1热度

    1回答

    有没有办法将日志从presto群集(协调器和工作者节点)推送到像logstash这样的集中式日志记录系统? 感谢, Dheeraj

    -1热度

    1回答

    我的Hive Metastore和HDFS群集不能直接访问本地计算机,并且我使用SSH端口转发来访问它。使用SSH监听本地端口1080的动态SOCKS代理,但错误是:查询失败:UnknownHostException linux-hostname

    0热度

    1回答

    在PrestoDB创建表时 CREATE TABLE orders ( orderkey bigint, orderstatus varchar, totalprice double, orderdate date ) WITH (format = 'ORC') 您可以指定format = 'xxx'据to the docs。除了'ORC'我知道有一个

    0热度

    3回答

    我在做一些基准测试,它由以下数据流: 卡夫卡 - >星火流 - >卡桑德拉 - > Prestodb 基础设施:我的火花流应用程序运行在4个执行器上(每个内核2个内核4g)。每个执行器都运行在安装了Cassandra的datanode上。 4 PrestoDB工作人员也位于数据节点中。我的集群有5个节点,每个节点都有一个Intel Core i5,32GB DDR3 RAM,500GB SSD和1