我今天早些时候提出一个问题,当我在Stackoverflow中遇到令人惊讶的功能时。当我写了我的问题标题stackoverflow建议我几个相关的问题,我发现已经有两个类似的问题。那太棒了!如何实现“相关”度度量算法?
然后我开始思考如何实现这样的功能。我怎么会为了通过关联的问题:
- 问题有较多的 话与新的问题
- 配衬如果配衬的数量是 相同,词的顺序被认为是
- 词在标题中出现 更高的相关性
这将是一个简单的工作流程或复杂的分数algortithm?有些可能会增加召回率? 有没有一些库实现这个功能? 你会考虑哪些其他方面?也许杰夫可以回答自己!你是如何在Stackoverflow中实现的? :)