我可以在互联网上运行统计分析的数据集?用于运行统计分析的数据集
回答
http://www.data.gov/可能有你可以使用的东西。
在其目录的原始数据,你可以设置你的标准数据,并找到你正在寻找http://www.data.gov/catalog/raw
最近的设置,但不应该的问题。涵盖从废弃汽车到学校旷工到农产品价格指数的所有内容
一捆268 small text files("The R Book"
的工作示例)可在The R Book's companion website中找到。
的datasets
包是包含在基地R.运行这个命令来查看完整列表:
library(help="datasets")
除此之外,还有包含重要数据很多的包,可以提取数据,以及其他许多。其中,您可能希望先看看HistData包,该包提供了一组在统计和数据可视化历史上很有意义且重要的小数据集。
对于财务数据,the quantmod
package提供了一个通用的接口从谷歌,雅虎,FRED,和其他人拉的时间序列数据:
library(quantmod)
getSymbols("YHOO",src="google") # from google finance
getSymbols("GOOG",src="yahoo") # from yahoo finance
getSymbols("DEXUSJP",src="FRED") # FX rates from FRED
FRED(the Federal Reserve of St. Louis)真的是自由经济数据的地雷。
许多R软件包都捆绑了特定于其目标的数据。因此,如果您对遗传学,多级模型等感兴趣,相关软件包将经常具有该分析的典型示例。此外,书包通常附带重现所有示例所需的数据。
下面是相关程序包的一些例子:
- alr3:包括数据陪应用线性回归(http://www.stat.umn.edu/alr)
- arm:包括一些从吉尔曼的“数据分析的回归和多级/数据分层模型“(其余数据和代码在the book's website)
- BaM:包括来自”贝叶斯方法:社会和行为科学方法“的数据
- BayesDA:包括数据从吉尔曼的“贝叶斯数据分析”
- cat:包括数据分类变量的数据集
- cimis的分析:从CIMIS,加州灌溉管理信息系统
- cshapes检索数据:包括GIS数据边界和数据
- ecdat:数据集计量经济学
- ElemStatLearn:包括从“统计学习,数据挖掘,推理的元素数据,与预测”
- emdbook:从数据‘:基于广义线性模型的多元统计建模‘
- fEcoFin:‘生态模式和数据’从书数据
- Fahrmeir’经济和金融数据集’为Rmetrics
- fds:功能数据集
- fma:数据集从 “预测:方法和应用”
- gamair:为“广义加法数据型号:其中R导论”
- geomapdata:地形和地质制图
- nutshell数据:包含所有来自数据‘R果壳中的’书
- nytR:提供经纽约前往国会投票数据倍API
- openintro:从书
- primer数据:包括用于 “生态学组成的引物,其中R”
- qtlbook数据:包括数据的R/QTL书
- RGraphics:包括从“R图形”一书
- Read.isi数据:访问旧世界生育率调查数据
看到的数据争夺Data Expo of the ASA Statistical Computing and Statistical Graphics区建立被哈德利韦翰。比赛结束,the data仍在那里。
你可以看看上this post on FlowingData
在网络上广泛选择。例如,这里有一个大型目录sports databases(全部免费提供数据,至少这是我的经验)。在那个目录是databaseBaseball.com,其中包含complete datasets为每个从1915年以来曾经打过职业棒球的球员。
StatLib是一个其他优秀的资源 - 非常方便。该单一web page列出了超过一百个数据库的4-5行摘要,只需单击每个数据集摘要开始处的“表格”链接即可以平面文件形式提供这些数据库。
R的基本分布预先打包了大量不同的数据集合(R 2.10中的122)。为了让他们的列表(以及一行说明):有几个数据集
data(package="datasets")
同样,大多数包都(有时更多)。你可以看到那些相同的方式:
data(package="latticeExtra")
data(package="vcd")
这些数据集是在包手册和护身符给定包提到的那些,并用来说明包的功能。 AER,DAAG和vcd。有很多数据集(这些数据集也很容易扫描,因此您可以选择对您感兴趣的内容)的几个R软件包:AER,DAAG和vcd。
另一件我觉得令人印象深刻的R是它的I/O。假设您想通过雅虎财务API获取一些非常具体的财务数据。比方说,关闭打开和关闭小号&普500的价格为每月二〇〇一年至2009年,只是这样做:
tick_data = read.csv(paste("http://ichart.finance.yahoo.com/table.csv?",
"s=%5EGSPC&a=03&b=1&c=2001&d=03&e=1&f=2009&g=m&ignore=.csv"))
在代码这一行,R已取出蜱数据,其形状为数据帧并将其全部绑定到'tick_data'。 (这里有一个方便的cheat sheet瓦特/用于构建作为上述网址的雅虎财经API符号)
精彩回答道格 - 谢谢! – 2010-02-14 10:56:03
我认为tick_data命令是错误的。您在粘贴部分中缺少sep =“”。 – csgillespie 2010-02-18 13:57:26
类似data.gov,但欧洲的中心是欧盟统计局
http://epp.eurostat.ec.europa.eu/portal/page/portal/statistics/search_database
,有一个中国的统计数据DEPARTEMENT,也由Wildebeests
http://www.stats.gov.cn/english/statisticaldata/monthlydata/index.htm
提及的还有一些“社会数据服务”,它提供的数据集,S的下载UCH为 旋转,manyeyes,timetric,CKAN,InfoChimps这类..
另一个好网站是UN Data。
经济 和社会事务部(DESA)部的联合国统计司 (司)推出了一个新的 基于互联网的数据服务 全球用户社区。它通过单个条目 点(http://data.un.org/)带来 联合国统计数据库容易到达 用户。现在用户可以通过 搜索并下载各种统计资源的 系统。
UC Irvine Machine Learning Repository目前有190个数据集。
的UCI机器学习库是 的数据库,域名 理论和数据生成器,用于机器 学习算法进行了实证分析所用的机器学习领域 的集合。
一个好的开始寻找经济数据始终是以下三个地址:
发展数据集链接的一个很好的总结经济学家可以在:
编辑:
世界银行上周决定开拓了很多的非自由先前的数据集,并将其在网上公布其修改后的主页。新的互联网外观也相当不错。
粮农组织提供aquastat数据库按国家区分各种与水有关的指标数据。
海军海洋学门户网站提供,例如,Fraction of the Moon Illuminated。
博客“弯曲正常”有a list of interesting data sources。
的over 800 datasets in ARFF format通过了Weka和其他数据分析软件包了解收集,聚集在TunedIT.org库。
下面是一个R包,其中包含一些来自书籍和论文的农业数据集。示例分析包括:agridat
- 1. 统计数据分析中的分散数据集
- 2. django gui的数据统计分析
- 3. 关于在网上发布的大数据集的统计分析
- 4. 进行统计分析
- 5. 用于运行统计测试的数据库
- 6. 禁用统计/分析Javascript
- 7. python统计分析
- 8. 变化列表数据帧进行统计分析
- 9. 用于统计数据的SQL函数
- 10. 在Rails 3.1中进行统计信息收集(分析)
- 11. SPSS中的统计分析
- 12. openstreetmap当前行星数据集的数据统计页面
- 13. 2sxc - 用于统计的查询数据
- 14. 收集审计和统计数据
- 15. 统计学余弦分析,
- 16. 分析查询统计
- 17. 访问用于记录和分析的MapReduce配置/统计
- 18. 用于数据库设计的静态分析工具
- 19. 收集Teradata中单个分区的统计数据
- 20. 用于网站分析的数据库
- 21. 用于数据分析的NoSQL或RDBMS
- 22. 用于分析PCM数据的Android API?
- 23. Android应用分析人口统计
- 24. 哪个MICE推测数据集用于后续分析?
- 25. Java库,用于文本分析和统计
- 26. 如何收集谷歌分析的计时数据
- 27. 从elasticsearch,mysql,谷歌分析,日志和创建统计数据
- 28. WSO2 APIM Analytics(分析)不显示任何统计数据
- 29. 从数据库收集统计
- 30. 基于数据子集的计数
哇谢恩,多么令人惊讶的详细答案 - 谢谢! – 2010-02-14 10:54:42
您也可以使用'tq_get()'函数添加'tidyquant'包来收集财务和经济数据。 – 2017-03-05 04:36:40