用于运行统计分析的数据集

library(quantmod) 
getSymbols("YHOO",src="google") # from google finance 
getSymbols("GOOG",src="yahoo") # from yahoo finance 
getSymbols("DEXUSJP",src="FRED") # FX rates from FRED

FRED（the Federal Reserve of St. Louis）真的是自由经济数据的地雷。

许多R软件包都捆绑了特定于其目标的数据。因此，如果您对遗传学，多级模型等感兴趣，相关软件包将经常具有该分析的典型示例。此外，书包通常附带重现所有示例所需的数据。

下面是相关程序包的一些例子：

alr3：包括数据陪应用线性回归（http://www.stat.umn.edu/alr）
arm：包括一些从吉尔曼的“数据分析的回归和多级/数据分层模型“（其余数据和代码在the book's website）
BaM：包括来自”贝叶斯方法：社会和行为科学方法“的数据
BayesDA：包括数据从吉尔曼的“贝叶斯数据分析”
cat：包括数据分类变量的数据集
cimis的分析：从CIMIS，加州灌溉管理信息系统
cshapes检索数据：包括GIS数据边界和数据
ecdat：数据集计量经济学
ElemStatLearn：包括从“统计学习，数据挖掘，推理的元素数据，与预测”
emdbook：从数据‘：基于广义线性模型的多元统计建模‘
fEcoFin：‘生态模式和数据’从书数据
Fahrmeir’经济和金融数据集’为Rmetrics
fds：功能数据集
fma：数据集从 “预测：方法和应用”
gamair：为“广义加法数据型号：其中R导论”
geomapdata：地形和地质制图
nutshell数据：包含所有来自数据‘R果壳中的’书
nytR：提供经纽约前往国会投票数据倍API
openintro：从书
primer数据：包括用于 “生态学组成的引物，其中R”
qtlbook数据：包括数据的R/QTL书
RGraphics：包括从“R图形”一书
Read.isi数据：访问旧世界生育率调查数据

来源

2010-02-12 14:31:26 Shane

+0

哇谢恩，多么令人惊讶的详细答案 - 谢谢！ – 2010-02-14 10:54:42

+0

您也可以使用'tq_get（）'函数添加'tidyquant'包来收集财务和经济数据。 – 2017-03-05 04:36:40

2

看到的数据争夺Data Expo of the ASA Statistical Computing and Statistical Graphics区建立被哈德利韦翰。比赛结束，the data仍在那里。

来源

2010-02-12 14:32:24

3

你可以看看上this post on FlowingData

来源

2010-02-12 14:37:24 Marek

7

在网络上广泛选择。例如，这里有一个大型目录sports databases（全部免费提供数据，至少这是我的经验）。在那个目录是databaseBaseball.com，其中包含complete datasets为每个从1915年以来曾经打过职业棒球的球员。

StatLib是一个其他优秀的资源 - 非常方便。该单一web page列出了超过一百个数据库的4-5行摘要，只需单击每个数据集摘要开始处的“表格”链接即可以平面文件形式提供这些数据库。

R的基本分布预先打包了大量不同的数据集合（R 2.10中的122）。为了让他们的列表（以及一行说明）：有几个数据集

data(package="datasets")

同样，大多数包都（有时更多）。你可以看到那些相同的方式：

data(package="latticeExtra") 
data(package="vcd")

这些数据集是在包手册和护身符给定包提到的那些，并用来说明包的功能。 AER，DAAG和vcd。有很多数据集（这些数据集也很容易扫描，因此您可以选择对您感兴趣的内容）的几个R软件包：AER，DAAG和vcd。

另一件我觉得令人印象深刻的R是它的I/O。假设您想通过雅虎财务API获取一些非常具体的财务数据。比方说，关闭打开和关闭小号&普500的价格为每月二〇〇一年至2009年，只是这样做：

tick_data = read.csv(paste("http://ichart.finance.yahoo.com/table.csv?", 
    "s=%5EGSPC&a=03&b=1&c=2001&d=03&e=1&f=2009&g=m&ignore=.csv"))

在代码这一行，R已取出蜱数据，其形状为数据帧并将其全部绑定到'tick_data'。（这里有一个方便的cheat sheet瓦特/用于构建作为上述网址的雅虎财经API符号）

来源

2010-02-12 14:37:58 doug

+0

精彩回答道格 - 谢谢！ – 2010-02-14 10:56:03

+0

我认为tick_data命令是错误的。您在粘贴部分中缺少sep =“”。 – csgillespie 2010-02-18 13:57:26

1

类似data.gov，但欧洲的中心是欧盟统计局

http://epp.eurostat.ec.europa.eu/portal/page/portal/statistics/search_database

，有一个中国的统计数据DEPARTEMENT，也由Wildebeests

http://www.stats.gov.cn/english/statisticaldata/monthlydata/index.htm

提及的还有一些“社会数据服务”，它提供的数据集，S的下载UCH为旋转，manyeyes，timetric，CKAN，InfoChimps这类..

来源

2010-02-12 15:29:34

1

我已经看到了你，你是在数据可视化显然感兴趣的其他问题。然后看看many eyes项目（表单IBM）和示例data sets。

来源

2010-02-12 15:45:24 ewernli

+0

非常感谢ewernli :) – 2010-02-14 10:58:43

3

另一个好网站是UN Data。

经济和社会事务部（DESA）部的联合国统计司（司）推出了一个新的基于互联网的数据服务全球用户社区。它通过单个条目点（http://data.un.org/）带来联合国统计数据库容易到达用户。现在用户可以通过搜索并下载各种统计资源的系统。

来源

2010-02-12 16:00:02 Shane

2

UC Irvine Machine Learning Repository目前有190个数据集。

的UCI机器学习库是的数据库，域名理论和数据生成器，用于机器学习算法进行了实证分析所用的机器学习领域的集合。

来源

2010-02-12 16:53:07

4

一个好的开始寻找经济数据始终是以下三个地址：

发展数据集链接的一个很好的总结经济学家可以在：

Devecondata

编辑：

世界银行上周决定开拓了很多的非自由先前的数据集，并将其在网上公布其修改后的主页。新的互联网外观也相当不错。

The World Bank - Open Data

来源

2010-02-14 07:34:26 mropa

1

粮农组织提供aquastat数据库按国家区分各种与水有关的指标数据。

海军海洋学门户网站提供，例如，Fraction of the Moon Illuminated。

博客“弯曲正常”有a list of interesting data sources。

来源

2010-02-27 13:25:55

3

的over 800 datasets in ARFF format通过了Weka和其他数据分析软件包了解收集，聚集在TunedIT.org库。

来源

2010-05-17 14:26:31 Marcin

1

Another collection of datasets。

来源

2010-09-05 09:15:04 lmsasu

0

下面是一个R包，其中包含一些来自书籍和论文的农业数据集。示例分析包括：agridat

来源

2012-10-08 22:14:38

用于运行统计分析的数据集

回答

相关问题