我有一个原始数据集,超过4,500行代表土地交易。其中一个现有的专栏是“Place”,并且在每个单元格值中,我通常将地区名称设置为Some Neighborhood
,但有时候当有一个地方我不知道时,我会添加公证记录中的其他信息,例如Some Neighborhood, Some County
或甚至Some Neighborhood, Some County (nicknamed)
。使用现有列上的逻辑测试在OpenRefine中创建列?
我想创建两个使用来自这一列的信息的新列。第一列包含上层行政区划,第二列包含上述行政区划 - 有点像缩小。
我想我会需要基于使用一种逻辑测试的现有列来创建新的列或如果 - 如果 - 如果 - 测试在那里我可以列举的Some Neighborhood
属于County 1
或County 2
或City 1
等值。然后,基于这个新的专栏,我会创建另一个有State 1
,State 2
等,假定使用相同的测试。
如何在Open Refine GREL中使用正则表达式编写此代码?如何将多个串联在一起可能的在单元格中找到的值?我尝试使用cells
和value.contains
,但我不知道如何将这样的倍数串起来。
所以再回顾一下,我想脚本的方式来创建包含基于现有值的列新的单元格值的新列,像
“如果Street1
,Street2
,Street5,
但不Street3
,或Street4
,然后County1
“
OR
“如果Street1
或Street2
或Street5,
然后County1
然后如果Street3
或Street4
然后County2
”
编辑: 这里有一些数据:
land sale 0.350 carreau 350 gourdes Bullet
land sale 1.000 carreau 700 gourdes Campèche
land sale 0.200 carreau 220 gourdes Bremont
land sale 0.500 carreau 150 gourdes Pierrette
land sale 5.000 carreau 225 gourdes Lagenivrée
land sale 0.125 carreau 200 gourdes Bullet
land sale 1.000 carreau 300 gourdes Tozin
land sale 0.125 carreau 100 gourdes Dufort
land sale 0.250 carreau 135 gourdes Charitte, Savann Brute
land sale 0.500 carreau 300 gourdes Ravines des Roches
land sale 0.500 carreau 80 gourdes Isidore (Nègre Libre)
land sale 0.500 carreau 215 gourdes Nordette (Boures)
land sale 0.250 carreau 200 gourdes Bullet (Morne Montègue)
这是考试有两个新列的预期结果的PLE,让我们说“公社”和“节”:
land sale 0.350 carreau 350 gourdes Limonade Bwadlans Bullet
land sale 1.000 carreau 700 gourdes Limonade Bwadlans Campèche
land sale 0.200 carreau 220 gourdes Limonade Bwadlans Bremont
land sale 0.500 carreau 150 gourdes Limonade Roucou Pierrette
land sale 5.000 carreau 225 gourdes Limonade Roucou Lagenivrée
land sale 0.125 carreau 200 gourdes Limonade Bwadlans Bullet
land sale 1.000 carreau 300 gourdes Quart_Mor Sablé Tozin
land sale 0.125 carreau 100 gourdes Limonade Bwadlans Dufort
land sale 0.250 carreau 135 gourdes Limonade Bwadlans Charitte, Savann Brute
land sale 0.500 carreau 300 gourdes Limonade Bwadlans Ravines des Roches
land sale 0.500 carreau 80 gourdes Limonade Bwadlans Isidore (Nègre Libre)
land sale 0.500 carreau 215 gourdes Limonade Bwadlans Nordette (Boures)
land sale 0.250 carreau 200 gourdes Limonade Bwadlans Bullet (Morne Montègue)
你可以发布您的数据样本?开放式细化通常需要屏幕录像,使用数据要比重现它们容易得多。 –
好的,添加了10行样本数据 –
我不明白。你在你的帖子街区,县,街道中提到,但是你的样本数据中没有这样的内容。我的问题是,我什至不知道你想要做什么。 –