data-quality

    0热度

    1回答

    我试图用R脚本过滤出像'ffff'和'fdaljfdlksajf'这样糟糕的开放答案(字符串变量)。我希望R中有一些可用的字典包,我可以这样做,但我似乎无法找到它。 另一种选择是上传荷兰语(这是我需要的字典)单词列表并将其与输入进行比较,但这不是很容易找到。 你们有没有曾经尝试过这种做法,并找到了解决办法?

    0热度

    1回答

    有人可以帮我定义一个数据质量框架来分析某种数据吗?只是对它应该做什么的高层次的描述?只是你的想法。

    1热度

    1回答

    我试图制定一个查询,当某些字段是全部相同的字符时拒绝一行。 IE浏览器。我想选择名为Smith的人,但不是名为aaaaaa或bbbb的人。 我不能使用正则表达式,因为Firebird's SIMILAR TO doesn't have backreferences。 你会怎么做?

    0热度

    2回答

    我正在寻找能够帮助匹配拼写错误的两个单词的任何库。例如,创业板应标明下列陈述为真(这只是一个例子,没有必要有扩展的标准字符串) 'Start' == 'Strat' 'woodpecker' == 'Wodpekcer' 任何红宝石的宝石数据质量检查?

    0热度

    1回答

    我正在使用Talend Open Studio大数据版本TOS_DQ-20141207_1530-V5.6.1.zip学习数据质量。 根据我的问题,我想使用tMatchGroup,但我意识到它没有出现在Talend Studio的调色板中。在help.talend.com上,他们说我必须订阅“Talend平台产品”之一。 (https://help.talend.com/display/Talen

    0热度

    1回答

    我有两个问题。 1)我试图将我的对象在Source Analyzer视图中排列成某种有组织的格式,这样我就可以对它进行排序。但是,当我转到布局控制面板时,“整理所有”的源分析器选项会“灰显”。 有什么办法来安排或组织对象? 2)虽然源中的对象由我从中导入的数据库组织,但导航器中没有这样的组织视图用于目标。所有的目标都只是倾倒在导航仪中!有没有办法让我在导航器中组织目标文件夹中的表格视图? 我无法在

    1热度

    1回答

    与用于数据集成的Talend Open Studio(TOS)不同,用于数据质量的TOS既不具有项目和工作区选择的启动画面也不允许更改Studio中的工作项目。 :( 我想至少要更改工作区位置,不使用默认的是安装文件夹下!

    1热度

    2回答

    下面的代码是一个包含温度分组数据的样本(记住这是一个人在医院采取的温度)从我们的源系统。 显然,数据是可怕的,但不知道是否有可能以某种方式把这些数据转化和INT,因为我们有一个计量单位(计量单位)字段,所以我们只需要数。 数据问题: 88度显然华氏和摄氏不是3635 将36.35 0.368将是36.8 37.3。将37.3 .37.7是37.7 377将37.7 .3.8将为38 我觉得任何其它

    1热度

    1回答

    我正在通过以下链接处理数据仓库中的数据质量问题。 。 http://www.kimballgroup.com/2007/10/an-architecture-for-data-quality/ “ 响应质量事件 我已经说过,每个质量屏拥有决定何时发生错误时会发生什么情况的选择是:1)暂停过程中,2)发送违规结果,以供以后的处理的悬念文件,以及3)仅标记的数据,并将其通过以在管道中的下一个步骤。第三

    4热度

    2回答

    假设我有一个表作为这样: Date Sales 09/01/2017 9000 09/02/2017 12000 09/03/2017 0 09/04/2017 11000 09/05/2017 14400 09/06/2017 0 09/07/2017 0 09/08/2017 21000 09/09/2017 15000 09/10/2017 23100 09/11/2