我正在为2个字符串进行抄袭检测,为此我使用“Levenshtein距离算法”查找抄袭百分比和“tf idf”来查找关键字。但是现在我遇到了突出显示文本类似文本的问题,我正在考虑使用关键字作为种子来形成簇并突出显示该簇,但似乎很多工作。任何人都可以指导我如何去做,或者任何其他方式。请帮助我完成我的大学项目。tf-idf的实现
0
A
回答
0
我使用LCS获得公共子(我知道它并不完美),并使用@Mithgroth高亮这些子
1
假设你有你自己的方式找到文本类似的话,你可以添加你周围要标记的字跨度标签,给他们类的属性,以及CSS类设置为背景 - 颜色:黄色;
我假设你有一个foreach评估来检查文本中的每个单词。
foreach (word in words)
{
if (*word is similar*)
{
word = "<span class='highlight'>" + word + "</span>";
}
}
,并在你的HTML/CSS
.highlight
{
background-color: yellow;
}
+0
感谢您的帮助,它帮助我突出显示文本的问题。 –
相关问题
- 1. TFIDF在Python
- 2. 分类LDA与TFIDF
- 3. Tfidf向量不工作
- 4. Mahout TFIDF字典文件
- 5. 绘制文档tfidf 2D图
- 6. Python ScikitLearn与TFIDF的GridSearchCV问题 - JobLibValueError?
- 7. TFIDF与以前预处理的数据
- 8. 矩阵的维数减少TFIDF
- 9. numpy的矩阵尺寸-TFIDF矢量
- 10. 什么是理想的tfidf矩阵
- 11. 使用TFIDF的余弦相似度
- 12. 。bcrypt的实现,实现HashAlgorithm?
- 13. Python和tfidf算法,让它更快?
- 14. scikit-learn SelectPercentile TFIDF数据特征缩减
- 15. 使用Lucene计算TFIDF分数
- 16. 结合Sklearn TFIDF与其他数据
- 17. PickerView在Titanium中实现的TableView实现
- 18. 在python中实现R表的实现
- 19. CPython内部实现的文档实现
- 20. 实现polynimial类实现
- 21. NSArray的实现
- 22. malloc的实现?
- 23. getUTF8Length的实现
- 24. Dynatable的实现
- 25. 的hashCode实现
- 26. MiniMax的实现
- 27. 的FIFO实现
- 28. BufferedIterator的实现
- 29. addShutdownHook的实现
- 30. MvxBindableCollectionViewSource的实现
这甚至还没有接近余弦相似性和tf-idf。一次有一个问题。 – Paparazzi
我知道那不是余弦相似性和tf-idf,我目前正在使用这个来找到百分比,并且正在学习余弦相似度来替换它。 –