我在.rData文件中给出了一些数据。格式是字符模式下的xts
对象。 (I意识到这是一个不寻常的格式,但我有在它没有控制)如何将字符串矩阵转换为粗体?
> head(trades)
SYMBOL EX PRICE SIZE COND BID BIDSIZ OFR
2012-05-04 09:30:00 "BAC" "T" "7.89" "38538" "F" "7.89" "523" "7.9"
2012-05-04 09:30:01 "BAC" "Z" "7.885" "288" "@" "7.88" "61033" "7.9"
2012-05-04 09:30:03 "BAC" "X" "7.89" "1000" "@" "7.88" "1974" "7.89"
2012-05-04 09:30:07 "BAC" "T" "7.89" "19052" "F" "7.88" "1058" "7.89"
2012-05-04 09:30:08 "BAC" "Y" "7.89" "85053" "F" "7.88" "108101" "7.9"
2012-05-04 09:30:09 "BAC" "D" "7.8901" "10219" "@" "7.89" "268" "7.9"
> mode(trades)
'character'
我想通过转换成理智格式,即tibble来处理这些数据,这样我可以存储该列作为日期时间,双打和整数。
我设法用下面的代码来实现这一目标:
> trades_ = bind_cols(data_frame(DATE=index(trades)), as_data_frame(coredata(trades))) %>%
mutate_at(as.numeric, .cols=vars(PRICE, BID, OFR)) %>%
mutate_at(as.integer, .cols=vars(SIZE, BIDSIZ, OFRSIZ))
> head(trades_)
# A tibble: 6 × 10
DATE SYMBOL EX PRICE SIZE COND BID BIDSIZ OFR
<dttm> <chr> <chr> <dbl> <int> <chr> <dbl> <int> <dbl>
1 2012-05-04 09:30:00 BAC T 7.8900 38538 F 7.89 523 7.90
2 2012-05-04 09:30:01 BAC Z 7.8850 288 @ 7.88 61033 7.90
3 2012-05-04 09:30:03 BAC X 7.8900 1000 @ 7.88 1974 7.89
4 2012-05-04 09:30:07 BAC T 7.8900 19052 F 7.88 1058 7.89
5 2012-05-04 09:30:08 BAC Y 7.8900 85053 F 7.88 108101 7.90
6 2012-05-04 09:30:09 BAC D 7.8901 10219 @ 7.89 268 7.90
我不知道是否有已经为这个内置的功能。查看trades
矩阵的每一列,并计算出它是一列整数,双精度等,并将其转换为适当的类型。
这是csv解析器会做的事情。
'?type.convert',这是因为你猜到了,作为''read.csv'等read.table'你 – thelatemail
可能会更好过明确设置类型这样的辅助函数。当计算机猜错时追踪错误可能是一个痛苦。 –
@HongOoi:我认为你可能是对的,'type.convert'不喜欢''SIZE'列中的''1e + 05'' ... – user357269