cloudera

0热度

1回答

我有Cloudera的5.7生态系统，我使用的Solr和色调， Solr中我有一个像srcNamepostTtl 我希望它会在色调显示为SourceName领域和PostTitle而不接触Solr。 Hue有一些配置，我可以更改显示名称？

0热度

2回答

我会尽可能地解释我的问题。我想，以滤除日期表（只选择记录都包含在当月日期）和甲骨文的SQL我使用下面的查询来实现这样的目标： select * from table t1 where t1.DATE_COLUMN between TRUNC(SYSDATE, 'mm') and SYSDATE 我怎样才能在Hive SQL中复制相同的过滤器？我应该用来应用过滤器的列是TIMESTAMP类型列

0热度

1回答

Morphilines在convertTimestamp中添加了一些分钟

我有一个morphilines和solr的问题，我可以用flume和morphilines发送事件日志以存储在solr中以供以后处理，但是此事件日志具有此格式的时间戳记“2017-05- 17T15：20：00.848528" 在morphilines，我加了convertTimestamp片段： { convertTimestamp { field : fechaError inputFo

0热度

1回答

使用Cloudera索引PDF文档搜索

我一直在尝试使用Cloudera搜索又名Apache Solr来索引pdf文档。首先，我能够对Twitter推文进行索引。后来我尝试索引PDF文件。我已使用默认架构使用solrctl创建了相应的集合。我使用的morphline文件（我已经掩盖zkHost这里的IP地址）... solrLocator : { # Name of solr collection #collecti

0热度

2回答

将文件复制到HDFS Hadoop

我目前正在为我在大学的一次演讲工作。任务是从https://www.gutenberg.org/下载一本书并将其复制到HDFS中。我试过使用put <localSrc> <dest>，但它根本没有工作。这是我的代码看起来是在终端的时刻： [[email protected] ~]$ put <pg16328.txt> <documents> 庆典：附近意外的标记语法错误'<' 任何帮助表示赞

0热度

1回答

针对不同磁盘大小的节点的HDFS数据写入过程

我们有10个节点HDFS（Hadoop-2.6，cloudera-5.8）群集，4个磁盘大小为10TB，磁盘大小为6TB，节点数为3TB。在这种情况下，磁盘在小型磁盘节点上不断充满，但磁盘在高磁盘大小的节点上可用。我试图理解，namenode如何将数据/块写入不同的磁盘大小节点。无论是平分还是写数据的某个百分比。

0热度

1回答

Impala扫描MapR-FS慢

我最近在三节点MapR群集上安装了Impala。当我运行一个简单的查询时，性能不如Impala + HDFS。以下是查询： SELECT * FROM ft_test, ft_wafer WHERE ft_test_parquet.id = ft_wafer_parquet.id and month = 1 and day = 8 and param = 2913; 花了大约3秒。但

0热度

1回答

蜂巢版本模式

我正在通过Hive发布版本，并观察Hive版本的模式似乎有点线。在2015年6月27日的1.2.1发布之后，2016年2月15日的下一个版本为2.0，版本将继续。再次于2017年4月7日，即最近又发布了Hive 1.2.2版本。我没有明白为什么1.2.2而不是2.x.y. 有人可以解释一下。在此先感谢。

0热度

1回答

上传许可证文件通过API

使用全新安装这应该是直接，但每次我尝试上传许可证，我收到一个奇怪的错误信息。我正在使用curl上传许可证文件。 curl -X POST \ http://server_IP:7180/api/v13/cm/license \ -H 'authorization: Basic YWRtaW46YWRtaW4=' \ -H 'cache-control: no-cac

0热度

1回答

导入错误：libsasl2.so.3：无法打开共享对象文件：

我写了这个代码没有这样的文件或目录： from pyhive import hive connection = hive.connect("quickstart.cloudera", username="cloudera", port=10000) cursor = connection.cursor() query = "SELECT * FROM capacite