2016-07-07 86 views
0

我对Python很新颖,...呃...让我们说,在编码方面不是真正的专家。因此,提前非常缺乏业余爱好的问题。我正在尝试合并几个googletrends report.csv文件以用于我的研究。在Python中合并GoogleTrends数据报告

两个问题我遇到:

  1. 报告文件不只是一个电子表格,但含有大量的是不相关的其他信息。即我只想要合并每个文件的某个数组(真的只是想要每天的数据包含日期和每个月的相应SVI)说:列6到30)

  2. 由于(日常)数据将从月度报告文件中提取,月份没有固定的天数,我不能只使用固定列数来读取,但需要根据特定月份的天数来确定。

非常感谢您的帮助!

编辑:

我使用的代码:

import pandas as pd 
report = pd.read_csv('C:/Users/paul/Downloads/report.csv', skiprows=4, skipfooter=17) 
print(report) 

The output it produces

我设法削减前几行过,但我不知道如何从切断底位从第31行开始。所以skipfooter似乎没有工作。但是由于月份没有相同的天数,所以我不能使用nrows,所以我不会提前知道行数。

+0

需要你有什么样的东西和你想要的东西 –

+0

一个友好的指针 - 虽然这里的人肯定乐意提供帮助,但这不是一个'为我代码'服务。他们喜欢看到你先走了。 – dodell

+0

对不起,我承认,这是一个相当混乱的问题。查看上面的代码和输出。 – PaulWohlfarth

回答

0

事实证明,它确实有助于偶尔读取python给出的警告。

ParserWarning:由于'c'引擎不支持skip_footer;因此回落到'python'引擎。你可以通过指定engine ='python'来避免这个警告。

我有这个问题,skip_footer选项不起作用,显然与使用的c引擎有关。

对于运行到同一问题的人,这里是我解决了它的代码:

import pandas as pd 
report = pd.read_csv('C:/Users/paul/Downloads/report.csv', skiprows=4, skip_footer=27, engine='python') 

print(report) 

只需添加引擎=“蟒蛇”摆脱的C发动机的问题。不要问我为什么最终跳过了27行(我确信我计数为17),但是有一些试验和错误,这只是工作。