0
我有成千上万的大型标签云数据集;我可以检索每个组的加权标签云用一个简单的选择/组语句(例如)比较大型加权标签云集?
SELECT tag, COUNT(*) AS weight
FROM tags
WHERE set_id = $set_id
GROUP BY tag
ORDER BY COUNT(*) DESC
我想知道的是 - 什么是比较加权标签云的最佳途径找到最相似的其他集合,以重量(出现的一组中的数字)考虑在内,甚至可能是计算比较分数,都在同一个有些effiecient声明?
我发现缺乏在网络上的话题质量文献,认为它一定程度上广泛有关,并试图抽象我的例子,以保持它的普遍适用。
虽然理论似乎声音,我不知道如何在飞行比较上千套的标签时,这会实现,在一个幸福的声明.. – JeremyFelix 2010-06-19 16:41:29
通常不需要这些密集的任务是实时数据,因此你并不需要能够在MySQL中完成它们,只需获取云并以异步方式处理它们即可。然后将结果存储在数据库中。 – Jack 2010-06-19 16:43:07