cloudera

    0热度

    1回答

    我有Cloudera的5.7生态系统,我使用的Solr和色调, Solr中我有一个像srcNamepostTtl 我希望它会在色调显示为SourceName领域和PostTitle而不接触Solr。 Hue有一些配置,我可以更改显示名称?

    0热度

    2回答

    我会尽可能地解释我的问题。我想,以滤除日期表(只选择记录都包含在当月日期)和甲骨文的SQL我使用下面的查询来实现这样的目标: select * from table t1 where t1.DATE_COLUMN between TRUNC(SYSDATE, 'mm') and SYSDATE 我怎样才能在Hive SQL中复制相同的过滤器?我应该用来应用过滤器的列是TIMESTAMP类型列

    0热度

    1回答

    我有一个morphilines和solr的问题,我可以用flume和morphilines发送事件日志以存储在solr中以供以后处理,但是此事件日志具有此格式的时间戳记“2017-05- 17T15:20:00.848528" 在morphilines,我加了convertTimestamp片段: { convertTimestamp { field : fechaError inputFo

    0热度

    1回答

    我一直在尝试使用Cloudera搜索又名Apache Solr来索引pdf文档。首先,我能够对Twitter推文进行索引。后来我尝试索引PDF文件。我已使用默认架构使用solrctl创建了相应的集合。我使用的morphline文件(我已经掩盖zkHost这里的IP地址)... solrLocator : { # Name of solr collection #collecti

    0热度

    2回答

    我目前正在为我在大学的一次演讲工作。任务是从https://www.gutenberg.org/下载一本书并将其复制到HDFS中。我试过使用put <localSrc> <dest>,但它根本没有工作。 这是我的代码看起来是在终端的时刻: [[email protected] ~]$ put <pg16328.txt> <documents> 庆典:附近意外的标记语法错误'<' 任何帮助表示赞

    0热度

    1回答

    我们有10个节点HDFS(Hadoop-2.6,cloudera-5.8)群集,4个磁盘大小为10TB,磁盘大小为6TB,节点数为3TB。在这种情况下,磁盘在小型磁盘节点上不断充满,但磁盘在高磁盘大小的节点上可用。 我试图理解,namenode如何将数据/块写入不同的磁盘大小节点。无论是平分还是写数据的某个百分比。

    0热度

    1回答

    我最近在三节点MapR群集上安装了Impala。当我运行一个简单的查询时,性能不如Impala + HDFS。以下是查询: SELECT * FROM ft_test, ft_wafer WHERE ft_test_parquet.id = ft_wafer_parquet.id and month = 1 and day = 8 and param = 2913; 花了大约3秒。但

    0热度

    1回答

    我正在通过Hive发布版本,并观察Hive版本的模式似乎有点线。 在2015年6月27日的1.2.1发布之后,2016年2月15日的下一个版本为2.0,版本将继续。再次于2017年4月7日,即最近又发布了Hive 1.2.2版本。我没有明白为什么1.2.2而不是2.x.y. 有人可以解释一下。 在此先感谢。

    0热度

    1回答

    使用全新安装这应该是直接,但每次我尝试上传许可证,我收到一个奇怪的错误信息。 我正在使用curl上传许可证文件。 curl -X POST \ http://server_IP:7180/api/v13/cm/license \ -H 'authorization: Basic YWRtaW46YWRtaW4=' \ -H 'cache-control: no-cac

    0热度

    1回答

    我写了这个代码没有这样的文件或目录: from pyhive import hive connection = hive.connect("quickstart.cloudera", username="cloudera", port=10000) cursor = connection.cursor() query = "SELECT * FROM capacite