对于数据挖掘项目,我需要将80个制表符分隔的文件(每个100 MB)转换为CSV文件。任何人都知道一些在这种情况下可以方便使用的工具。将分隔符分隔为CSV
-4
A
回答
0
下载python:https://www.python.org/downloads/
安装它。
并运行类似于以下内容的脚本。
以下内容作为convert_tsv_to_csv.py
或任何在.py
结束:
import csv
with open('C:\\path\to\file','r') as f:
tab_file = csv.reader(f, dialect=csv.excel_tab)
with open('C:\path\to\outfile.csv','w') as g:
comma_file = csv.writer(g, dialect=csv.excel)
for row in tab_file:
comma_file.writerow(row)
更改路径和运行它想:python convert_tsv_to_csv.py
的基本思想: 如果文件很大,通过阅读这些线线。
0
了解您的基本工具。
在任何的UNIX/Linux/OSX系统中,每个下面的命令应该做的伎俩:
sed -i -e 's/\t/,/g' *.csv
perl -i -p -e 's/\t/,/g' *.csv
这些执行基本选项卡以逗号替换。如果您的数据包含带有表格或逗号的列,或者为您编写文件名,他们将不会处理引用和转义等内容。请注意,sed
和perl
的语法非常相似...... -i
就地编辑,-e
执行命令,s///
是正则表达式替换的语法。等
无论哪种方式,您的基本Unix工具这份工作是
- 极快(以下简称“流编辑器”
sed
是很好的优化,低级别的C代码) - 方便(只是一些10按键!)
- 使用方便,一旦你学会的基础知识(即阅读手册)
相关问题
- 1. XPath分隔符/分隔符
- 2. 用CSV分隔字符串
- 3. 更改CSV分隔符Clipobard.GetData()
- 4. 使用Ruby CSV更改导出的CSV中的字段分隔符/分隔符
- 5. 打开制表符分隔的CSV并保存为制表符分隔
- 6. 使用SED或AWK使用分隔符分隔.csv列数据
- 7. Java CSV行分隔
- 8. 用“||”分隔字符串分隔符
- 9. 分隔字符串与分隔符
- 10. 分隔符分隔字符串RadTreeView VB.NET
- 11. 将excel单元格中的数据与分隔符分隔为“;”
- 12. 分隔多个分隔符,同时保持分隔符为字典键
- 13. pandas read_csv使用unicode字符作为分隔符/分隔符。
- 14. 导出为CSV将所有字符分隔为字段
- 15. 如何将带分隔符的CSV文件导入为“;”和小数点分隔符为“,”到SAS?
- 16. 将数字与由$符号分隔的字符串分隔吗?
- 17. 解析分隔符分隔值
- 18. 如何按分隔符分隔值?
- 19. C++:用'\ t'分隔符分隔char *
- 20. 使用多个分隔符和复制分隔符在CSV文件中分隔列值
- 21. TPT'æ'分隔符
- 22. 分隔字符
- 23. CONCAT_WS分隔符
- 24. 将字符串分隔 -
- 25. sed将删除分隔符
- 26. 转换文件,CSV的分隔符fomat
- 27. CSV字段分隔符的问题
- 28. str_getcsv在制表符分隔CSV
- 29. 蟒蛇CSV分隔符的问题
- 30. 如何创建制表符分隔CSV?
有很多的工具来做到这一点。您使用什么操作系统? – jmunsch 2014-11-14 20:49:36
感谢您的回复,我正在使用Windows 8.1。或者,如果在其他操作系统中有任何方便的工具,我可以切换。 – shubham90 2014-11-14 20:53:57
如果你不熟悉任何脚本语言,我会建议Open Office Calc:http://stackoverflow.com/questions/2549800/how-to-convert-tsv-to-csv-using-openoffice只要文件没有超过限制?:https://wiki.openoffice.org/wiki/Documentation/FAQ/Calc/Miscellaneous/What%27s_the_maximum_number_of_rows_and_cells_for_a_spreadsheet_file%3F或者尝试安装python并使用'csv'模块。 – jmunsch 2014-11-14 21:11:38