这不是一个直接编程相关的问题,而是关于选择正确的数据挖掘算法。建议这种情况的数据挖掘算法
我有一些文件夹假设100个文件夹,这些文件夹的内容是图像和文本文件,我有这些文件夹的excel表(100表),这意味着每个文件夹都有特定的表格,这个excel表格内容如下:
在标题(列标题)中包含此文件夹的内容,并且行包含我将检查的文件(我的测试文件)此表中的值是o和1的文件,如果在该文件夹中找到该文件,则值为1否则O,这些测试文件名相同的所有文件夹,
问:什么是最好的数据挖掘算法可以在Excel文件表工作,可以群集这些文件夹浅编辑测试文件内容,例如群集1包含文件夹,其中包含文件1和文件20以及文件25 ..等等..考虑使用matlab语言?
感谢...