pandas

1热度

1回答

所以我试图从here刮起头条新闻。整整十年。 years这里是一个列表，其中包含 /resources/archive/us/2007.html /resources/archive/us/2008.html /resources/archive/us/2009.html /resources/archive/us/2010.html /resources/archive/us/2011.

2热度

4回答

如何获取自定义时间间隔中的最后日期？ - 熊猫

可能我的例子是很多大，我的代码是在这里： import pandas as pd import numpy as np import io t = """ name date a 2005-08-31 a 2005-09-20 a 2005-11-12 a 2005-12-31 a 2006-03-31 a 2006-06-25 a 2006-07-23 a

0热度

2回答

如何根据数据框中的列值获取特定行数

假设我有这种方式的MNIST数据集。 df = pd.read_csv('data/train.csv') data = df.loc[df['label'].isin([1,6])] 我想只选择那些行其列[“标签”] == 1或6 不过，我想从每列仅获得500行[“标签”] 我该怎么做？

0热度

2回答

如何在datetime数据框中获取多年的月份数？

我有以下的datetime数据框： df = pd.DataFrame({'year': [2015, 2015 ,2016,2014], 'month': [2,11, 3,9], 'day': [4,21, 5,10]}) df = pd.to_datetime(df) 我想要得到的 'MONTH_NUMBER'。对应于跨越多年连续一个月算我期望的结果将是：

1热度

1回答

pandas df'A'和'B 1'是列名。我如何参考'B 1'如df.A？

相同的问题适用于列名，例如'C.1'... 对于列名“B 1”和“C 1”是否有df.A这样的快捷方式，而不是df['B 1']和df['C.1']？

0热度

1回答

分析年龄组和生存率之间的相关性

#First, I divide the age group as follow , # 1. group A: 0-17years old; # 2. group B: 18-35years old # 3. group C: 36-50years old # 4. group D: 51-65years old # 5. group E: above 66 years old

0热度

1回答

采摘使用GROUPBY熊猫随机元素

我有数据帧，看起来像这样： revisionId itemId wikidataType 1 307190482 23 Q5 6 305019084 80 Q5 8 303692414 181 Q5 9 306600439 192 Q5 11 294597048 206 Q5 在完全数据帧，则不存在中柱wikidataType 100个这样不同的值。它是

1热度

2回答

如何更新基于Python中已有列的新列

我有一个数据帧'df'，其中列df ['dead_notdead']的值为[{'out'}，{'out'，'soak'}。 ....]我想创建一个名为df ['Fatal']的列，如果df ['dead_notdead']的值为空，那么df ['Fatal']应该为0其他1. 文件格式 DF大小16343 Input index Dead_notdead 0 {'out'

-1热度

1回答

大熊猫取而代之NaN

我最近开始尝试用于Python的熊猫。我已经加载从EXCELL一个数据帧，其结果如下： Datum Fotonummer Werkput Vlak Spoornummer Oriëntatie Onderwerp Fotograaf 2011-05-16 1 1 1.0 1 N Vlakfoto Spoor 1 DIM 2011-05-16 2 1 1.0 1

1热度

1回答

在使用熊猫导出数据框时使用ExcelWriter有什么好处？

我正在使用熊猫数据框来存储一些数据，并且我想将它导出到excel文件中以便于阅读/格式化。我尝试了运行 df.to_excel('sheet.xlsx') ，并将其保存在我的工作文件夹没有问题的sheet.xlsx。我想知道为什么我想在使用.to_excel（）方法之前使用ExcelWriter对象？似乎有很多额外的不必要的步骤，如创建对象，然后再次保存该对象。