2017-04-11 118 views

回答

2

您可以使用read_csv与参数skiprowsnames新列名:

url = 'https://www.google.com/finance/getprices?q=HINDALCO&i=60&p=15d&f=d,o,h,l,c,v' 
df = pd.read_csv(url, skiprows=[0,1,2,3,5,6]).rename(columns={'COLUMNS=DATE':'DATE'}) 

print (df.head()) 
      DATE CLOSE HIGH  LOW OPEN VOLUME 
0 a1490154300 194.80 194.80 194.80 194.80 2600 
1   1 193.55 194.70 193.00 194.15 339142 
2   2 193.80 193.95 193.55 193.60 242687 
3   3 194.20 194.40 193.80 193.90 119874 
4   4 193.80 194.20 193.80 194.20 121355 
+0

感谢亲爱的很多 –

+0

你对日期时间有什么想法我怎么能转换日期[1]意味着1分钟日期2意味着2分钟等等 –

+0

好吧,但'a1490154300'意味着什么?这是日期还是时间? – jezrael

0

如果你不讲究让您的只有谷歌的数据,这将工作无线th Yahoo:

import pandas as pd 
import pandas_datareader.data as web 
from datetime import datetime 

start = datetime(2014, 6, 2) 
end = datetime(2014, 9, 5) 

hindalco = web.DataReader('HINDALCO.NS', 'yahoo', start, end) 

In [15]: hindalco.head(5) 
Out[15]: 
      Open High  Low Close Volume Adj Close 
Date               
2014-06-02 147.3 151.15 146.35 150.05 13844600 146.2012 
2014-06-03 150.7 155.70 149.35 155.20 23276100 151.2191 
2014-06-04 156.0 161.75 155.20 160.70 15948200 156.5780 
2014-06-05 160.6 171.00 159.95 169.85 20296900 165.4934 
2014-06-06 172.0 172.10 165.30 169.25 13769100 164.9087 

您需要安装pandas-datareader。

sudo -H pip install pandas-datareader (ubuntu) 
pip install pandas-datareader (windows) 
+0

我曾尝试使用'HINDALCO'作为公司代码和谷歌而不是雅虎,但这并没有奏效。然而,美国股市像苹果与谷歌合作: 苹果= web.DataReader(“AAPL”,“谷歌”,开始,结束) – dmdip

+0

我想1mins数据不是每天 –

0

@jezrael]已回答您对Hindalco一分钟数据的问题。这里的或多或少相同的答案,调整了一下:

import pandas as pd 
period = 60 #one minute 
days = 2 # 2 days of data 
ticker = 'HINDALCO' 
url = 'http://www.google.com/finance/getprices?i={}&p={}d&f=d,o,h,l,c,v&df=cpct&q={}'.format(period, days, ticker) 
cols = ['minute', 'open', 'high', 'low', 'close', 'volume'] 
df = pd.read_csv(url, skiprows=8, header=None, names=cols) 
df.head() 

输出:

minute open high  low close volume 
0  1 194.35 194.35 193.80 193.85 25785 
1  2 194.15 194.40 194.00 194.35 64580 
2  3 193.95 194.25 193.85 194.15 42980 
3  4 193.80 193.95 193.75 193.90 33936 
4  5 193.90 193.90 193.60 193.80 57088 
+0

我可以更改分钟1格式上午9:15如此在 –

+0

是的,你可以。您必须使用显示为** a1490154300 **的字段值。基本上1490154300是数据的起始时间,以1970年1月1日5.30 AM IST的秒数来衡量。 (实际上是0000 UTC)。 要在该字段值中添加显示在该列中的分钟数。 – dmdip

+0

更正前面给出的代码。 df = pd.read_csv(url,skiprows = 7,header = None,names = cols) – dmdip