我想要一个读取文档中的文本并说它是用哪种语言(英语,西班牙语,...)的java代码。文件的格式并不重要。我希望输出是例如:“这份文件是西班牙文”。请以这种方式引导我,并给我一个示例代码。语言检测器
Q
语言检测器
1
A
回答
3
+0
*“**注意:** Google Language Detect API必须用于用户生成的语言检测。严格禁止任何类型的自动或批量查询。“* – 2012-02-06 16:24:40
0
的标准方法是建立n元模型的候选语言,然后建立目标文档一个类似的模型,并使用一个简单的比较,对参考模型编辑距离计算。 Gertjan van Noord的网站http://www.let.rug.nl/vannoord/TextCat/competitors.html可链接到您可以使用的多个图书馆。
0
language-detection库在Java中使用非常简单(请参阅示例代码)和健壮性。检测来自各种家庭的至少53种语言。
相关问题
- 1. 浏览器语言检测
- 2. 语言检测
- 3. 语言检测
- 4. 检测iOS语言
- 5. CLI语言检测
- 6. Solr语言检测
- 7. 在java中检测浏览器语言
- 8. 浏览器自动检测语言
- 9. Symfony 3,检测浏览器语言
- 10. 检测浏览器语言环境/语言并生成输出
- 11. 语言检测API/Library
- 12. 检测NSString的语言
- 13. 检测输入语言?
- 14. 较短的语言检测
- 15. 检测Android语言支持
- 16. python网站语言检测
- 17. 检测编程语言
- 18. 检测文本的语言
- 19. NLTK和语言检测
- 20. 可变语言(浏览器语言检测) - 不在safari中工作
- 21. 添加浏览器语言检测后,语言href锚点(hl)停止工作
- 22. 微软认知语言到文本 - 检测语言
- 23. 检测语言和django语言环境-url
- 24. 浏览器语言检测和重定向vs Google机器人
- 25. 如何检测软键盘语言?
- 26. 如何检测Visualstudio的语言版本?
- 27. Ruby Rails Gem来检测其他语言
- 28. 极短文本的语言检测
- 29. 语言检测重定向(主页)
- 30. 梨包语言检测上PHP 7
大多数文档格式将该信息嵌入其元数据中。对于纯文本文件,是的,你必须做一些魔术。 – 2012-02-06 16:20:21
这是问题解答网站,那么你的问题是什么,我建议阅读常见问题解答... – Nettogrof 2012-02-06 16:21:34
你需要根据所使用的单词使用猜测。我会为每种语言创建一个单词词典并尝试匹配它们。注:一些简短的文件可能是。 – 2012-02-06 16:21:37