2011-10-11 68 views
1

我在尝试从GWAS catalog获取特定疾病相关信息。这可以通过电子表格下载直接从网站完成。但我想知道如果我可以在R中以编程方式执行它,任何建议都将不胜感激。与R检索GWAS信息

谢谢。

Avoks

回答

2

结帐功能download.file()和封装rcurl(http://cran.r-project.org/web/packages/RCurl/index.html) - 这应该做你正在寻找

+0

感谢赖,我会检查出来。 – Avoks

0

你将不得不首先下载.tsv文件并手动编辑它们。 这是因为GWAS目录文件包含HTML符号,如“Behçet's disease”(定义特殊的第四个字母)中的&#x000A7。该这些符号将被R解释为线的末端,因此,你会得到一个错误信息,如:

 
line 2028 did not have 34 elements 

所以,你首先downlad它,在纯文本编辑器打开时,自动更换每空字符,才把它加载到R:

 
read.table("gwas_catalog_v1.0-associations_e91_r2018-02-21.tsv",sep="\t",h=T,stringsAsFactors = F,quote="")