当您使用命令pd.read_csv, 读取csv时如何跳过包含特定行的行? 如果在第50,55行中,第1列的值为100,所以当我读取csv文件时,我想跳过这些行。 如何将这些命令放入像pd.read_csv('read.csv')这样的读入命令? 该值的总长度为300.阅读熊猫数据框时跳过包含特定值的特定行
-1
A
回答
2
0
唯一的方法是预解析该文件。使用发生器读取文件,然后只需要yield
即可。然后,您可以使用它将您想要的行读取到StringIO
对象中,并将该对象在文件路径的位置传递给read_csv
。
import StringIO
import pandas as pd
def read_file(file_name):
with open(file_name, 'r') as fh:
for line in fh.readlines():
parts = line.split(',')
if parts[0] != '100':
yield line
stream = StringIO.StringIO()
stream.writelines(read_file('foo.txt'))
stream.seek(0)
df = pd.read_csv(stream)
相关问题
- 1. 熊猫数据框减少特定日期之间的行值
- 2. 在python熊猫数据框中指定特定的日期值
- 3. 如何从包含特定列中特定字符串的熊猫数据框中删除行?
- 4. 如何从大熊猫数据帧包含在特定列
- 5. 将熊猫数据框值写入特定表格中的特定单元格。
- 6. 特定组通过熊猫
- 7. 找到熊猫数据框中特定alpha的临界值?
- 8. 返回熊猫数据框中特定列的int值
- 9. 如何删除熊猫数据框中特定日期的行?
- 10. 大熊猫数据框中列和特定的行变换
- 11. 在熊猫数据框中有效过滤窗口化观察值(如果它们包含特定值)
- 12. 阅读url数据特定行java
- 13. 使用熊猫在数据框上写入特定行
- 14. 阅读excel的特定行
- 15. 在熊猫数据框中返回行,其中列中的元组包含特定值
- 16. 如何确定大熊猫特定记录的行数据帧
- 17. 熊猫读取特定的日期和时间范围CSV数据帧行
- 18. 使用python更改特定熊猫数据框列中的行值
- 19. 选择特定值的特定列大熊猫
- 20. 熊猫数据框中特别计数
- 21. 在熊猫度假村特定的列数据框
- 22. 子集熊猫数据框在特定月份的日期列?
- 23. 如何查看熊猫的特定行?
- 24. 熊猫数据框包含列表
- 25. 在特定值后跳过连续行
- 26. 熊猫:加入一行数据上的特定指数
- 27. php - 获取在特定列中包含特定值的csv行
- 28. 隐藏在特定列中包含特定值的行
- 29. 在熊猫数据框的列中存储特定值的计数
- 30. cumsum大熊猫高达特定的值 - 蟒蛇大熊猫
什么是价值的长度? – jezrael
以后放弃它们,而不是根本不读它们有什么区别?你可以简单地做:'pd.read_csv('file.csv')。query('col1!= 100')'... – Kartik
^^^^^^^^^^那! @卡蒂克,为什么不是一个答案? – piRSquared