2014-09-18 69 views
-1

只是一个简短的问题分开非结构化数据......有人plz帮助我如何读R中的下列文本文件..如何阅读#R中

如果#(分隔符)是彼此相邻。 ..这意味着缺失值...

任何想法?或小费?谢谢你的种类

20040215#680# - 。6#7.6#1457#-7.3#735#1.2#340.3#13.6#1427#0#0 ## - 7.3#735#7.6#1457 ## = 18#680#0.4#11.1#1541#-7.3#635#0.9#130.1#6.6#1137#0#0 ## - 7.3#635#11.1#1541 ## = 20040221#680 ########## 7#2#1600#1.7#559#7.3#1604 ## = 98835
20040222#680 ########## 1 #### #6.8#1108 ## = 98836
20040223#680 ########## 0#0 #### 6.8#1602 ## = 98837

+0

所以你说'# '是文件分隔符,它也代表NA值?你可以看看你的例子在读入R之后应该看起来像什么吗? – 2014-09-18 16:14:43

+0

你尝试了什么?它看起来像'scan'和'strsplit'可以提供帮助。 – DrDom 2014-09-18 16:15:31

+0

@Jacob Green 6 upvotes并没有被接受? – akrun 2014-09-19 20:45:02

回答

6

这似乎做了相当整洁的工作 - 只是告诉read.table分离哈希和不使用哈希作为注释(否则事情负荷担心迷路评论):

> read.table("hash.hsv",sep="#", comment="") 
     V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 
1 20040215 680 -0.6 7.6 1457 -7.3 735 1.2 340.3 13.6 1427 0 0 NA -7.3 
2  18 680 0.4 11.1 1541 -7.3 635 0.9 130.1 6.6 1137 0 0 NA -7.3 
3 20040221 680 NA NA NA NA NA NA NA NA NA 7 2 1600 1.7 
4 20040222 680 NA NA NA NA NA NA NA NA NA 1 NA NA NA 
5 20040223 680 NA NA NA NA NA NA NA NA NA 0 0 NA NA 
    V16 V17 V18 V19  V20 
1 735 7.6 1457 NA = 98829 
2 635 11.1 1541 NA = 98834 
3 559 7.3 1604 NA = 98835 
4 NA 6.8 1108 NA = 98836 
5 NA 6.8 1602 NA = 98837