我有一个包含160万行数据的CSV,大约150MB,它包含产品数据。我有另一个包含2000行的CSV文件,其中包含大CSV中的产品列表。它们通过唯一的ID相互关联。这个想法是用2000行添加CSV格式的产品数据。使用160万行(150MB)文件搜索CSV文件?
该databank.csv有标头ID
,Product Name
,Description
,Price
。 sm_list.csv
的标题为ID
。
结果是在sm_list.csv
中输出带有产品的csv,相应的数据为databank.csv
... 2000行。
我的原始解决方案读取所有sm_list
,并逐行读取数据库。它在sm_list
中搜索从数据库读入的行中的ID
。这导致了2000x1.6百万= 3200万的比较!
您能否提供一个基本的算法大纲以最有效的方式完成此任务?