pandas

    1热度

    1回答

    所以我试图从here刮起头条新闻。整整十年。 years这里是一个列表,其中包含 /resources/archive/us/2007.html /resources/archive/us/2008.html /resources/archive/us/2009.html /resources/archive/us/2010.html /resources/archive/us/2011.

    2热度

    4回答

    可能我的例子是很多大,我的代码是在这里: import pandas as pd import numpy as np import io t = """ name date a 2005-08-31 a 2005-09-20 a 2005-11-12 a 2005-12-31 a 2006-03-31 a 2006-06-25 a 2006-07-23 a

    0热度

    2回答

    假设我有这种方式的MNIST数据集。 df = pd.read_csv('data/train.csv') data = df.loc[df['label'].isin([1,6])] 我想只选择那些行其列[“标签”] == 1或6 不过,我想从每列仅获得500行[“标签”] 我该怎么做?

    0热度

    2回答

    我有以下的datetime数据框: df = pd.DataFrame({'year': [2015, 2015 ,2016,2014], 'month': [2,11, 3,9], 'day': [4,21, 5,10]}) df = pd.to_datetime(df) 我想要得到的 'MONTH_NUMBER'。对应于跨越多年连续一个月算我期望的结果将是:

    1热度

    1回答

    相同的问题适用于列名,例如'C.1'... 对于列名“B 1”和“C 1”是否有df.A这样的快捷方式,而不是df['B 1']和df['C.1']?

    0热度

    1回答

    #First, I divide the age group as follow , # 1. group A: 0-17years old; # 2. group B: 18-35years old # 3. group C: 36-50years old # 4. group D: 51-65years old # 5. group E: above 66 years old

    0热度

    1回答

    我有数据帧,看起来像这样: revisionId itemId wikidataType 1 307190482 23 Q5 6 305019084 80 Q5 8 303692414 181 Q5 9 306600439 192 Q5 11 294597048 206 Q5 在完全数据帧,则不存在中柱wikidataType 100个这样不同的值。它是

    1热度

    2回答

    我有一个数据帧'df',其中列df ['dead_notdead']的值为[{'out'},{'out','soak'}。 ....]我想创建一个名为df ['Fatal']的列,如果df ['dead_notdead']的值为空,那么df ['Fatal']应该为0其他1. 文件格式 DF大小16343 Input index Dead_notdead 0 {'out'

    -1热度

    1回答

    我最近开始尝试用于Python的熊猫。我已经加载从EXCELL一个数据帧,其结果如下: Datum Fotonummer Werkput Vlak Spoornummer Oriëntatie Onderwerp Fotograaf 2011-05-16 1 1 1.0 1 N Vlakfoto Spoor 1 DIM 2011-05-16 2 1 1.0 1

    1热度

    1回答

    我正在使用熊猫数据框来存储一些数据,并且我想将它导出到excel文件中以便于阅读/格式化。 我尝试了运行 df.to_excel('sheet.xlsx') ,并将其保存在我的工作文件夹没有问题的sheet.xlsx。我想知道为什么我想在使用.to_excel()方法之前使用ExcelWriter对象? 似乎有很多额外的不必要的步骤,如创建对象,然后再次保存该对象。