apache-pig

    7热度

    6回答

    Pig是用于处理超大文件的数据流编程环境。猪的语言叫做猪拉丁语。 有没有人知道PigLatin的参考手册?我正在寻找包含该语言所有语法和命令描述的内容。不幸的是,猪维基的维基页面被破坏了。

    0热度

    1回答

    我有一个猪计划,我试图计算两个行李之间的最小中心。为了使它起作用,我发现我需要将袋子集中到一个数据集中。整个操作需要很长时间。我想从硬盘的包装袋或者打开一个UDF中,或者能够通过另一个关系到UDF而不需要协同组...... 代码: # **** Load files for iteration **** register myudfs.jar; wordcounts = LOAD 'input

    14热度

    3回答

    有人可以解释一下MapReduce如何与Cassandra.6搭配使用吗?我已经读过了字数统计的例子,但我并不完全了解Cassandra的结局与“客户端”的结局。 https://svn.apache.org/repos/asf/cassandra/trunk/contrib/word_count/ 举例来说,假设我使用Python和Pycassa,我将如何加载新的地图功能降低,然后再打电话吗?我

    9热度

    2回答

    Apache的猪将数据存储到SequenceFile可以使用的PiggyBank SequenceFileLoader负荷的Hadoop序列文件数据在那里可以写入Pig的Hadoop序列文件?

    0热度

    2回答

    我有一个猪脚本,它激活了另一个python程序。 我可以在自己的hadoop环境中这样做,但是当我在亚马逊地图中运行我的脚本时,我总是失败减少WS。 日志说: org.apache.pig.backend.executionengine.ExecException:ERROR 2090:接收的错误在处理减少计划: '' 失败,退出状态:127 在org.apache.pig .backend.ha

    4热度

    3回答

    假设我有猪以下输入: some ,我想将其转换成: s so som some 我还没有(还)找到了一种在拉丁语中迭代chararray的方法。我已经找到了TOKENIZE函数,但它在字边界上分裂。 那么“猪拉丁”可以这样做还是这需要Java类来做到这一点?