我解析了用逗号分隔的Python文件,其中一些文本字段是用引号双分隔的,因为文本包含非定界逗号。例如,给定此线路输入的:用Python解析双定界文件
field_1,field_2,...,"this,field,contains,non-delimiting,commas",...,field_n
我需要治疗"this,field,contains,non-delimiting,commas"
作为含有讨厌的逗号单引号分隔字段。
我的代码通过比较每行输入中的所有逗号和引号的索引,并在配对引号之外的所有逗号的索引处对行进行切片来处理此操作。
虽然这让我觉得非pythonic,我希望能得到一些获得更多pythonic解决方案的建议。
像field_1这样的字段可以像整数吗?例如123,“helloWorld”,99,“ha,ha,ha” –
@ SamuelToh:是的。字段可以包含任何字符并表示任何数据类型。在这个阶段唯一的考虑就是在处理内部分隔符时将字段标记为文本。 – Schemer
使用csv阅读器:https://docs.python.org/2/library/csv.html –