我一直在搜索,浏览stackoverflow正则表达式解决方案,直到我眼镜蛇。正则表达式帮助 - 嵌入报价字符串中的双引号
我有一个第三方解决方案提供了一个“制表符分隔的文本文件”,但我已经确定了生成这个文件的任何东西是嵌入双引号(甚至没有转义它们) - 我想知道它的可能性使用RegEx从文件中清除这些错误(我在导入之前在文件上使用FNR)。
每行数据包含14列,制表符分隔,每个字段周围都有双引号,如预期的那样。所有的缺陷发生在第2场或第10场(不是第一场或最后一场),因为这些都是训练课程 - 一些教练使用名称中带有双引号的名字 - 而这份第三方报告并没有逃避它们。我希望之前和正确的引号后赶上TAB - 和过滤任何内部错误双引号或者\正确转义”
"......" "ADC000000" "Being the "Best" you can be" "2F8A776C" "...."
"......" "BBC555555" ""Golden Opportunity"" "8F4C3DEE" "...."
所需的输出
"......" "ADC000000" "Being the \"Best\" you can be" "2F8A776C" "...."
"......" "BBC555555" "\"Golden Opportunity\"" "8F4C3DEE" "...."
或(取是最简单的,并且相当快的文件中都有22万行,只有16-50错误)
"......" "ADC000000" "Being the Best you can be" "2F8A776C" "...."
"......" "BBC555555" "Golden Opportunity" "8F4C3DEE" "...."
遗憾的这个冗长,但我想这个问题是因为possi清晰BLE。
非常感谢Avinash的快速响应,这看起来非常接近 - 但也在每行的开头和结尾都选择了引号。有没有办法避免匹配这些情况? – RLW 2014-09-21 12:59:12
不,你看过上面的演示吗? – 2014-09-21 13:01:06
我可能说话太快了,我正在使用debuggex.com尝试自己弄清楚 - 但我遵循了你的演示链接,它没有这个问题。请给我一点时间来弄清楚如何将这些信息提供给FNR。 – RLW 2014-09-21 13:27:21