apache-pig

    1热度

    1回答

    我的命令是为下: Z = LOAD '/..file_path' USING PigStorage(',') AS (name:CHARARRAY,gpa:int,salary:int); y = GROUP Z BY gpa; R = FOREACH y GENERATE SUM(Z.salary); 我得到的 DUMP R; 输出为: {all,()}; 请指导我。 TIA。

    0热度

    1回答

    猪脚本中是否有使用这种语法的方法? 命令: /* some pig latin code here */ mv /user/test/folder_pattern* /path/to/move /* some pig latin code here */ 错误: [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 2997: En

    -1热度

    1回答

    我正在运行此配置单元查询以获得非结构化数据上的单词明智数。 select a, count(*) from (select(EXPLODE(SPLIT(regexp_replace(upper(word,'[[email protected]#$%&*]',''))) AND EXPLODE(SPLIT(regexp_replace(UPPER(word,'[^A-Za-z0-9 ]','')))

    2热度

    1回答

    我有猪脚本,当我从猪(地图减少模式)运行时给出正确的结果,但是当我从crontab计划不按照脚本存储输出。 猪脚本, a1 = load '/user/training/abhijit_hdfs/id' using PigStorage('\t') as (id:int,name:chararray,desig:chararray); a2 = load '/user/training/abhi

    1热度

    3回答

    我正在尝试使用Hadoop和Apache Pig。我有一些数据和脚本中的.txt文件.pig与我的脚本文件: student = LOAD '/home/srv-hadoop/data.txt' USING PigStorage(',') as (id:int, firstname:chararray, lastname:chararray, phone:chararray, city:

    -1热度

    1回答

    我的问题是,如果有一种方法可以从script2.pig访问sript1.pig中的关系“data1”版本,而无需再次加载数据? script1.pig具有: data1 = LOAD '$some_location'USING PigStorage('\t') AS (...); RUN script2.pig; EXEC; script2.pig有: filter1 = FILTER dat

    0热度

    1回答

    袋子上用枚举 我尝试使用下面的代码来枚举袋: DEFINE Enumerate datafu.pig.bags.Enumerate('1'); group = GROUP data1 By (query_text); ranked = FOREACH group { ordered = ORDER data1 BY score DESC;

    -1热度

    1回答

    卸妆数据考虑CSV数据的以下两行: 01-15-2014 12:04:05, row1 2014/02/20, row2 第1行具有所需的时间戳格式MM-DD-YYYY HH:MM:SS。第2行时间戳需要转换为匹配。那么我怎样才能完成这项任务。

    0热度

    1回答

    空行我有一个数据集,像一击: 1,abc,10000 ,zxcv,2000 , , , 4,xyz,50000 我想输出,如: 1,abc,10000 zxcv,2000 4,xyz,50000 我怎样才能实现这个任务? 即我想删除空行和null值。

    -1热度

    1回答

    我有一个单一的文件中的以下数据 "HD",003498,"20160913:17:04:10","D3ZYE",1 "EH","XXX-1985977-1",1,"01","20151215","20151215","20151229","20151215","2304",,,"36-126481000",1340.74,61808.00,1126.62,0.00,214.12,0.00,0.0