pandas

    1热度

    1回答

    我正在寻找相当于R的mutate,它允许您在创建它们之后立即引用已定义的变量在相同的mutate调用内。 new_df <- old_df %>% mutate(new_col = ifelse(something, 0, 1), newer_col = ifelse(new_col == 0, 'yay', 'nay')) 在python熊猫中寻找等价物。 如果我创建

    1热度

    1回答

    我有这样的数据集, PRODUCT_ID SALE_DATE SALE_PRICE PROVIDER 1 01/02/16 25 1 1 02/10/16 60 1 1 01/11/16 63 2 1 09/10/16 65 3 2 11/11/15 54 1 2 13/01/16 34 2 3 19/05/14 45 1 3

    0热度

    1回答

    广泛地说,我有来自Kaggle的智能量表数据集,我试图按房子计算第一个和最后一个量度,然后尝试聚合以查看有多少房屋开始(或结束)报告给定的一天。我接受的方法完全不同于我在下面追求的路线。 在SQL中,探索数据时,我经常使用类似以下内容: SELECT Max_DT, COUNT(House_ID) AS HouseCount FROM ( SELECT House_ID, MAX(Da

    0热度

    2回答

    我有一个SQL数据库,它有两列。其中有时间戳,其他保存数据以JSON格式 例如DF: ts data '2017-12-18 02:30:20.553' {'name':'bob','age':10, 'location':{'town':'miami','state':'florida'}} '2017-12-18 02:30:21.101' {'name':'dan','age

    1热度

    4回答

    我需要使一些名称格式匹配稍后在我的脚本中进行合并。我列“名称”是从CSV导入并包含类似名称如下: 安东尼布朗 莱西恩·麦考伊 莱夫翁·贝尔 对于我的剧本,我想获得第一个名字的第一个字母,并与姓氏结合起来这样.... A.Brown L.McCoy L.Bell 这里是我已经把现在返回一个烤饼每次: ff['AbbrName'] = ff['Name'].str.extract('([A-Z]\s[

    1热度

    1回答

    我有从CSV文件导入多个时间序列数据。 这些数据都有时间戳,但时间戳并不总是一致的: 时间系列1: UUT Data DateTime 2017-11-21 18:54:31 uut1 1 2017-11-22 02:26:48 uut1 2 2017-11-22 10:19:44 uut1 3 2017-11-22 15:11:28 uut1 6 201

    1热度

    2回答

    我有熊猫系列枣myS import pandas as pd 该指数是一组包含时间字符串的唯一 myS.index Out[28]: Index([u'12:00 AM', u'12:14 AM', u'12:18 AM', u'12:25 AM', u'12:26 AM', u'12:37 AM', u'12:41 AM', u'12:47 AM', u'12:55 AM'

    1热度

    1回答

    我有一个名为time的datetime列的Pandas数据框。我想计算每小时的行数。问题是,我希望生成的表格处理几小时不存在行。例如: time id lat lon type 0 2017-06-09 19:34:59.945128-07:00 75 36.999866 -122.058180 UPPER CAMPUS 1 2017-06-09 19:53:56.387058-07:00 7

    1热度

    1回答

    我有一个包含YYYY-MM-DD('arrival_date')形式的时间序列(作为索引)的熊猫数据帧和I我想每个星期一到星期天都要分组,以便计算其他列的平均值,中位数,标准偏差等等。我最终应该只有七行,到目前为止我只知道如何按周分组,每周汇总一切。 # Reading the data df_data = pd.read_csv('data.csv', delimiter=',') # P

    0热度

    1回答

    我有对象类型的这样的柱: quote['SellTime'].head() Out[32]: 0 94520 1 94538 2 94609 3 94615 4 94617 Name: SellTime, dtype: object 我想将其转换为对日期时间(datetime64 [NS])格式。 我也做了下面的代码: quo