我有一种类似于SQL搜索的任务。我有包含以下一维数组(约1百万个元素)通过ID1
标识的“表”:匹配两个numpy数组以找到相同的元素
ID1, z, e, PA, n
另一个“表”,其中包含由ID2
确定了以下一维数组(约1.5百万个元素):
ID2, RA, DEC
我想匹配ID1
和ID2
找到常见的形成含有ID, z, e, PA, n, RA, DEC
另一个“表”。 ID1
中的大多数元素可以在ID2
中找到,但不是全部,否则我可以使用numpy.in1d(ID1,ID2)
来完成它。任何人都可以快速完成这项任务?
例如:
ID1, z, e, PA, n
101, 1.0, 1.2, 1.5, 1.8
104, 1.5, 1.8, 2.2, 3.1
105, 1.4, 2.0, 3.3, 2.8
ID2, RA, DEC
101, 4.5, 10.5
107, 90.1, 55.5
102, 30.5, 3.3
103, 60.1, 40.6
104, 10.8, 5.6
输出应该
ID, z, e, PA, n, RA, DEC
101, 1.0, 1.2, 1.5, 1.8, 4.5, 10.5
104, 1.5, 1.8, 2.2, 3.1, 10.8, 5.6
添加一个可运行的样本和预期的o/p? – Divakar
熊猫是合并/加入数据集的合适位置:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.merge.html – cel