kettle

    2热度

    2回答

    我正在使用windows批处理文件调用Pentaho数据集成作业,间歇性地,作业被无限期挂起。 在Pentaho的日志中的错误信息如下: 06:43:37,951 ERROR [BlueprintContainerImpl] Unable to start blueprint container for bundle pdi-dataservice-server-plugin due to unr

    0热度

    1回答

    我的作业中有一个基本的Pentaho转换,通过“Table Input”步骤从SQL Server的存储过程读取5,000条记录。该数据有5列,其中之一是XML列。在'Table Input'之后,运行一个'文本文件输出'步骤,该步骤将保存路径从一个列和xml数据保存为字段选项卡中提供的唯一字段。然后,通过将数据从“表格输入”流式传输到“文本文件输出”,在给定位置创建5,000个XML文件。 执行

    0热度

    1回答

    我想知道如果我可以合并2个或更多的行在pentaho? 例如: 我有2行 case:'001', owner:'Barack' date:'2017-04-10' case:'001', owner:'Trump' date:'2017-02-10' 然后,我想有一个MongoDB的输出: case:'001' ownerHistory:[ { owner:'Barack'

    0热度

    2回答

    我想比较两个不同连接的两个表的两个行数。 我试着通过执行 Select count(*) as count1 from Table1 和 Select count(*) as count2 from Table2 得到两种不同的行对每个不同的表数量执行SQL脚本步骤,如下面的截图,但我不知道如何进行。 特别是,我想分别得到两个不同的计数并比较它们,然后分别用成功/失败分支它们是否相等。 我该如何做

    0热度

    1回答

    我有一个Pentaho作业,在其中一个转换中,我想获取文件夹中文件的数量。我尝试了两种不同的方法,但都花了2分钟才能执行。我想知道是否有一个步骤可以用来以更高效的方式来做到这一点。 方法1 - 获取文件的行数 - >设置变量 在我获取文件的行数步我的目录和通配符来获取XML文件的COUNT(* XML。)在一个文件夹中。在内容选项卡中,我将文件数保存到一个字段(fileCount)中,然后保存到一

    0热度

    2回答

    我正在做一个相当长的水壶转型,我在Flow的中间放了一些步骤。 因此,现在我的步骤指标全部被炒作并且很难阅读。 有没有什么办法可以将它排序(与流的方向一致)?

    0热度

    1回答

    我需要在R编程语言中重现水壶Dateif函数。我需要'过期月份'选项。我认为复制会很容易,但是我在pentaho中有一些'奇怪的行为'。作为一个例子: ID DATE_1日期2 monthly_difference_kettle daydiff_mysql 15943 31/12/2013 28/07/2014 7 209 15943 31/12/2011 27/07/2012 6 209 因此,

    0热度

    2回答

    我试图存储Pentaho作业的10个子作业和转换内部的日志。我知道我可以通过进入设置并将它们写入文本文件来单独完成每项工作和转换。但我不想为每个子作业需要太多的文件。有没有一种方法可以存储捕获所有子作业和转换的单个主作业的日志? 在此先感谢。

    0热度

    1回答

    我搜索了很多,我注意到有大部分的方式是使用工作或subjob来实现循环。 我认为这是一个废物系统的来源?这是一个好方法? 由于某些原因,我需要使用pentaho水壶ETL工具来完成我的工作,我在程序员中编写代码并知道循环语法,如'while','for','foreach'和某些特定的迭代器。通知水壶提供的脚本工具 - JavaScript让开发人员编写JavaScript代码或Java代码。 我

    0热度

    1回答

    我正在尝试读取文本文件并用正则表达式替换所有出现的“搜索词”与“替换词”并写入新文件。 我对pentaho水壶比较陌生,不确定哪个变换或一组步骤最适合这个用例?大多数转换按行或列读取数据,所以我不确定如何读取文本文件并执行查找替换操作?大多数文件都是逐行或按字段进行转换。 感谢您的时间和关注。