1
A
回答
3
我见过的技巧很简单,就是简单地计算所使用的字符数,并将其除以中文每个单词的平均字符数。通常用于此的数字是1.5
如果您的中文文本有1500个字符,则它大约有1000个字。
我不知道更精确的计算单词的方法,除了解释文本本身。这意味着要真正理解所使用单词的上下文,因为中文字符有时可以单独用作单词,也可以用作复合词的组成部分。
+0
这似乎是正确的比例:http://www.proz.com/forum/linguistics/58362-word_count_for_chinese.html。 “1.35:1〜1.8:1。通常我们取1.5:1” – 2011-12-21 00:02:59
相关问题
- 1. 计算字符串中的字符数
- 2. TI-84计算器语言中的打印字符串
- 3. 计算字符串中的字数?
- 4. Javascript计算字符串中的数字
- 5. 从字符串中提取不同语言的子字符串
- 6. 检查字符串是否只包含拉丁字符?
- 7. 检查字符串是拉丁字母还是西里尔文
- 8. 拉丁语言中的highlight.js英语
- 9. DB2 - 计算字符串字符数,不是长度
- 10. 验证字符串 - 仅限特定语言字符
- 11. 计算字符串中的字符
- 12. 计算不同字符串的数量?
- 13. 计算字符串输入的字数
- 14. 是否有可能将语言特定的字符转换为UTF8中的拉丁字符
- 15. 计算字符串中字符串的数量?
- 16. 的Python 3 - UTF-8字符串str的拉丁字符
- 17. 计算字符串中的位数
- 18. 计算字符串中的句子数
- 19. 计算字符串中的点数
- 20. 拉丁语中的猪拉丁语
- 21. solr搜索从拉丁语到本地语言字符的音译
- 22. 如何通过规范化版本的字符串匹配拉丁字符和非拉丁字符?
- 23. 计算字符串中的唯一字
- 24. 字符串字段中的计算MySQL
- 25. 用于拉丁字符的php搜索字符串
- 26. 语言字符串ADT
- 27. 语言字符串解析
- 28. 猪拉丁语涉及数字
- 29. 猪拉丁语,for循环,字符串问题
- 30. 创建函数来计算字符串中的字符数
这取决于该语言的单词定界符。出于好奇,中文单词如何结束? – Indranil 2011-12-20 23:47:33
这是一个很好的问题。 – dynamic 2011-12-20 23:48:11
这里是答案:http://www.anycount.com/WordCountBlog/tag/word-count-in-chinese/ – 2011-12-20 23:54:34