基于列的数据我想115个文件从一个目录结合在一起。这里的文件是什么样子的 例如:组合和多个文件和组织在bash
文件中的一个
Phenotype Marker Value1 Value2 Value3 P1 1:54390 0.2948 0.4837 0.2198 P2 1:54390 0.3482 0.6583 0.1937 P3 1:54390 0.1983 0.1837 0.4177 P4 1:54390 0.9128 0.9930 0.0043 P5 1:54390 0.1938 0.0109 0.6573 P1 1:69402 0.2039 0.2340 0.2346 P2 1:69402 0.0239 0.3545 0.1987 P3 1:69402 0.8239 0.8677 0.4177 P4 1:69402 0.2498 0.3099 0.0765 P5 1:69402 0.0982 0.0198 0.
文件中的两个
Phenotype Marker Value1 Value2 Value3 P1 9:21048 0.8568 0.1231 0.1654 P2 9:21048 0.1244 0.3213 0.1223 P3 9:21048 0.9869 0.1231 0.4776 P4 9:21048 0.3543 0.7657 0.0033 P5 9:21048 0.1231 0.3213 0.8578 P1 9:87758 0.1231 0.8768 0.4653 P2 9:87758 0.7657 0.5435 0.8845 P3 9:87758 0.9879 0.8437 0.7464 P4 9:87758 0.1231 0.9879 0.5523 P5 9:87758 0.9879 0.9868 0.0006
所以基本上每一个文件都有一组独特的标记,所有每个地方表型(P1,P2,P3,P4,P5)与它们匹配。
有两件事情:
答:我想一个文件看起来像这样(如下图),其中数据由 表型组织
Phenotype Marker Value1 Value2 Value3 P1 1:54390 0.2948 0.4837 0.2198 P1 1:69402 0.2039 0.2340 0.2346 P1 9:21048 0.8568 0.1231 0.1654 P1 9:87758 0.1231 0.8768 0.4653 P2 1:54390 0.3482 0.6583 0.1937 P2 1:69402 0.0239 0.3545 0.1987 P2 9:21048 0.1244 0.3213 0.1223 P3 1:54390 0.1983 0.1837 0.4177 P3 1:69402 0.8239 0.8677 0.4177 P3 9:21048 0.9869 0.1231 0.4776 P3 9:87758 0.9879 0.8437 0.7464 P4 1:54390 0.9128 0.9930 0.0043 P4 1:69402 0.2498 0.3099 0.0765 P4 9:21048 0.3543 0.7657 0.0033 P4 9:87758 0.1231 0.9879 0.5523 P5 1:54390 0.1938 0.0109 0.6573 P5 1:69402 0.0982 0.0198 0. P5 9:21048 0.1231 0.3213 0.8578 P5 9:87758 0.9879 0.9868 0.0006
我想这样做是bash。任何人都可以提供一些见解吗?我是 这个语言很新!
B.一旦我有了这个巨大的文件,我也想节省基于 表型独立的文件(我打算做一些质量控制的中间步骤),所以我 将有5个文件P1 ,P2,P3,P4,和与它们各自的数据P5在 其它列)
这并不涵盖表型 – 2013-05-07 19:43:30
现在排序是这样,那种错字...... – spiehr 2013-05-07 19:45:03
使用'在文件*;做'而不是调用'ls'。 – chepner 2013-05-07 21:55:07