2017-07-01 52 views
0

我有一个data.frame列以下的非结构化数据:把非结构化数据 - 每一行 - 在新的列

<a href="https://bitcoin.org/" target="_blank">Website</a> 
<a href="https://www.bitcoin.com/" target="_blank">Website 2</a> 
<a href="http://blockchain.info" target="_blank">Explorer</a> 
<a href="https://blockexplorer.com/" target="_blank">Explorer 2</a> 

<a href="https://bitcointalk.org" target="_blank">Message Board</a> 
<a href="https://forum.bitcoin.com/" target="_blank">Message Board 2</a> 


<small><span class="label label-success"> Rank 1</span></small> 
<small><span class="label label-warning">Mineable</span></small> 
<small><span class="label label-warning">Currency</span></small> 

我的目标是创建每一行的新列。

任何建议如何做到这一点?我目前对这个问题并不清楚。

回答

1

您可以简单地将文本复制并粘贴到.txt文件中。

然后调用:

library(tidyverse) 
a <- readLines("test.txt") %>% 
    # Convert to df 
    as.data.frame(stringsAsFactors = FALSE) %>% 
    # Filter empty rows 
    filter(nchar(.) != 0) 

科林