我需要计算文档内所有条款的频率。我怎样才能做到这一点 ? 我不要求密码。我只是要求指导。其实我正在做一些文件和查询之间的相似度计算。我已经为查询计算了术语频率。 但我不知道如何计算文件内每个单词的tern频率。任何人都可以引导我?感谢您的关注。需要统计文档中每个条款的频率
0
A
回答
1
您可以使用HashMap,其中key是您的术语和值 - 它的频率。每次你看到你的期限,你都会增加价值。文件完成后,你有你的号码。
1
是,使用HashMap的保存价值,并要经过文件,你可以使用一个Scanner
0
在Java中你一定要留在HashMap<String, Integer>
。术语将是HashMap键和术语频率值。
相关问题
- 1. 统计每个单词的频率
- 2. 如何统计阵列中每个单词的频率?
- 3. 如何确定每个文档中术语的术语频率?
- 4. 用于文档分类的计算IDF(逆文档频率)
- 5. 需要添加一个条款
- 6. 更好的SQL统计条款数与条款
- 7. 如何计算文本文档中所有单词的频率?
- 8. 文档中词语的频率
- 9. 文档中的字数频率
- 10. 需要将文档上传到MOSS文档库的系统
- 11. 如何计算文档字段中特殊术语的频率?
- 12. 计算每一行的频率
- 13. 重要性弹性搜索相关的计算逆文档频率的得分
- 14. 逻辑条件下的计数频率
- 15. SAS PROC频率 - 每个类别的频率为多个变量
- 16. 如何计算矢量中每个值的出现频率?
- 17. C语言频率统计(非C++)
- 18. 每个频率值带有一个条的直方图
- 19. 设计文档内容 - 需要什么?
- 20. 需要帮助在选择条款
- 21. SQL哪里条款帮助需要
- 22. 我怎样才能连续三个条款中的每一个条款?
- 23. 条款聚集 - 所有文档共有每个单词的获取
- 24. 语料库的逆文档频率
- 25. Solr - 在文档子集上查找“重要条款”
- 26. 需要找到相对频率
- 27. 根据文档频率消除查询条件
- 28. 计算SQL结果的每个值在哪里条款
- 29. SQLite:提取条款和文档从全文索引条目计数
- 30. 计算每个id在xml中每次出现的频率,使用php
你能指定文档如何表示吗? – ThomasRS 2011-03-14 15:56:53
您是否在发布之前尝试搜索?这被问**很多**。 – 2011-03-14 15:59:50
如果你正在寻找术语频率,[这是一个python程序](https://github.com/timtrueman/tf-idf/blob/master/tf-idf.py)将会计算出它。你可能想看看这个。 – slhck 2011-03-14 16:00:56