2017-02-03 96 views
-1

我已经在r中编写了一个非常快速的高级脚本,以便与NCBI blast API进行交互。然而,有时候,结果url需要一段时间才能加载,我的脚本会抛出一个错误,直到url准备就绪。有没有一种优雅的方式(即tryCatch选项)来处理错误,直到结果返回或在指定时间后超时?在r中等待结果或超时的循环

library(rvest) 
    ## Definitive set of blast API instructions can be found here: https://www.ncbi.nlm.nih.gov/staff/tao/URLAPI/new/BLAST_URLAPI.html 
    ## Generate query URL 
    query_url <- 
    function(QUERY, 
      PROGRAM = "blastp", 
      DATABASE = "nr", 
      ...) { 
     put_url_stem <- 
     'https://www.ncbi.nlm.nih.gov/blast/Blast.cgi?CMD=Put' 
     arguments = list(...) 
     paste0(
     put_url_stem, 
     "&QUERY=", 
     QUERY, 
     "&PROGRAM=", 
     PROGRAM, 
     "&DATABASE=", 
     DATABASE, 
     arguments 
    ) 
    } 

    blast_url <- query_url(QUERY = "NP_001117.2")  ## test query 
    blast_session <- html_session(blast_url)    ## create session 
    blast_form <- html_form(blast_session)[[1]]   ## pull form from session 
    RID <- blast_form$fields$RID$value  ## extract RID identifier 

    get_url <- function(RID, ...) { 
    get_url_stem <- 
     "https://www.ncbi.nlm.nih.gov/blast/Blast.cgi?CMD=Get" 
    arguments = list(...) 
    paste0(get_url_stem, "&RID=", RID, "&FORMAT_TYPE=XML", arguments) 
    } 
    hits_xml <- read_xml(get_url(RID)) ## this is the sticky part 

有时需要几分钟的时间get_url去住,所以我想什么做的就是继续努力,让我们说每20-30秒,直到它产生的URL或超时预后指定时间。

回答