kettle

    -1热度

    2回答

    有谁知道如何在水壶中找到像^.^这样的图案(例如,^ 44 ^,^!^)? '.'表示可以是单个或多个的任何字母。 我发现这个模式,>.<(例如,> 44!<)通过(.*)(>.*<)(.*) 所以我施加相同的方式(.*)(^.*^)(.*)。但它从来没有发现它。 其实我也不太清楚(。*)的含义,如果有人知道它,你能给一些建议吗?

    2热度

    1回答

    我有一个使用Pentaho的类项目。我需要使用2个不同的输入创建一个仪表板到PostgreSQL输出中。我的问题是,使用壶,我必须匹配进入Postgres的两个不同的.csv文件。其中一个是关于犯罪,另一个是关于天气。我手动添加了两列到天气之一,所以他们有两个匹配的列:'月'和'年'。 我的问题是如何使用这种匹配列(或不这样做,使任何意义),所以我可以在以后创建的仪表盘,使查询,如“其中承诺的时候

    0热度

    3回答

    我有一个包含数字的列的数据集。但是,该列中的某些行缺少数据。一个短划线( - )被放置在单元格中,而不是数字。 我想要发生的是用破折号分隔这些行,并将它们输出到单独的excel文件。那些没有破折号的,应该输出到一个csv文件。 我试着“过滤器行”,但它给我一个错误: Unexpected conversion error while converting value [constant Strin

    -1热度

    1回答

    我使用Kettle从oracle到ldap进行同步,但在ldap输出时出现了错误。 具有以下结构的用户。 A user with the following structure. second picture 下面是错误 2017年1月17日16时54分43秒 - 勺 - 正在打开转换[oracletoldap] ... 2017年1月17日16:54 :43 - Spoon - 开始执行转换。

    0热度

    2回答

    我将两个excel文件插入到pentaho中。 每个excel文件都有多个工作表。 例如我正在合并资产数据。 每个资产都有唯一的密钥。 使用完整外连接合并时,由于键上没有匹配项,因此会创建一个名为assetnum_1的新字段。因此我剩下两个字段:assetnum和assetnum_1。 我不想要assetnum_1。 我希望所有数据都在assetnum中。 有没有人知道解决这个问题的方法? 谢谢。

    0热度

    1回答

    我想使用步骤S3 CSV Input从s3存储桶加载多个文件,然后转换并重新加载回S3。但我可以看到这一步只支持一个文件,我需要提供文件名,有没有办法一次加载所有文件,只需提供桶名即<s3-bucket-name>/*?

    1热度

    1回答

    我正在处理这个新任务,其中我的输入csv文件有大约200到300万条记录,我的要求是对传入数据进行排序执行查找的键值并插入到目标表中。其中一个建议是编写一个java插件,将数据分类并存储在多个临时文件中(比如说每百万个文件)并从那里检索。我正在考虑在pentaho中使用排序步骤并设置开始的份数。但我不确定什么是最好的方法。任何人都可以建议如何去做这件事。谢谢。

    0热度

    1回答

    我有一个'查询'字段包含一个选择SQL和另一个'参数'字段包含SQL参数的表。我已经将这两个字段合并到一个包含正确选择sql语句的新字段中。现在我需要执行这个包含select sql的新字段,从select(输出字段)获取返回值并生成一个excel文件。

    0热度

    1回答

    我有一个要求,即必须将传入的XML碎化并加载到数据库中。 所有元素都有它们各自的表格。 传入XML看起来是这样的: <root> <creditreport> <data1> <A>val1</A> <B>val2</B> </data1> <data2> <C>val3</C> <D>val4</D>

    3热度

    1回答

    我想删除字符串字段中的特殊字符,如! @ # $ %^* _ = + | \ } { [ ] : ; < > ? /。 我使用了“在字符串中替换”步骤并启用了使用RegEx。但是,我不知道我将在“搜索”中删除字符串中所有这些字符的正确语法。如果我只在“搜索”中放置一个字符,它将从字符串中删除。我如何删除所有这些? 这是我怎么做的图片: