我有一个文件.ped谁包含多列,我想从中提取信息。 这里我的数据的样本(没有标头):使用r的数据处理
1 1 1
1 2 1
2 3 2
3 4 1
3 5 2
...
第一列表示的ID家族,第二个ID的个体,个体的第三性别。
我读表作为数据帧
ped <- read.table("pedigree.ped", header=FALSE)
我如何计算家庭的数量存在(一个家庭可以出现一个以上的时间,我要考虑他们作为一个)? 我有一个性别专栏,其中1个指定男性和2个女性,我如何获得数据集中男性和女性的分布?
我是R新手,如果你可以给一些代码!
谢谢先进。
请发送您的数据样本。 – 2013-04-06 01:48:27
^^^ this - 'head(ped)' – Nishanth 2013-04-06 01:50:12
请给我指数 – 2013-04-06 02:14:51