我的电脑上的应用程序需要读取文本文件。我有几个,一个不工作;该程序没有阅读它,并告诉我,它有一个坏字符在某处。我的第一个猜测是,在那里有一个非ASCII字符,但我不知道如何找到它。 Perl或任何通用的正则表达式都不错。有任何想法吗?搜索非ASCII文档
13
A
回答
12
4
perl -wne 'printf "byte %02X in line $.\n", ord $& while s/[^\t\n\x20-\x7E]//;'
会发现每一个字符不是一个ASCII字符glyphic,制表符,空格,或换行。
如果它在O.K.的文件中报告0D
s(回车),则将\t\n
更改为\t\n\r
。
如果它只报告0D
在坏的文件中,那么您可以通过在它们上运行dos2unix
来修复这些文件。
+0
只是附录,应该将输入作为最终未列出的参数。 – 2014-02-19 22:03:34
+0
就像那样,谢谢!我不得不在DOS控制台上稍微改变它: 'perl -wne“printf qq(字节%02X在$。\ n中),ord $&while s/[^ \ t \ n \ x20- \ x7E]//;”
2
如果您在源代码中使用制表为好,试试这个模式:
[^\x08-\x7E]
作品也在记事本++
相关问题
- 1. 学说可用非ASCII字符搜索
- 2. 搜索文档
- 3. Mac终端文档搜索
- 4. Nhibernate搜索文档编号
- 5. MongoDB - 搜索子文档
- 6. Marklogic PDF文档搜索
- 7. MongoDB嵌套文档搜索
- 8. 像文档搜索页面
- 9. RoR中的文档搜索
- 10. 正在搜索Riscv文档
- 11. 在XML文档中搜索
- 12. 搜索两个Lucene文档
- 13. 如何在Vim中使用正则表达式搜索字母(ascii和非ascii)?
- 14. 搜索A文档库或文档在Sharepoint文档库中
- 15. Solr不搜索整个索引文档
- 16. 搜索和检索在线文档
- 17. MySQL搜索非ASCII字符不按预期的方式工作
- 18. Lucene不搜索完整的非ASCII字符
- 19. 使用索引范围搜索ascii
- 20. Solr非英文索引和搜索
- 21. 在Android下的文件搜索文档
- 22. 搜索一行文本文档 - JAVA
- 23. 使用grep来搜索文本文档
- 24. 在文件系统上搜索文档
- 25. 如何将PowerPoint文档和Excel文档放入全文搜索索引(如Sphinx或PostgreSQL文本搜索)中?
- 26. 发送非ASCII文本
- 27. 想出一个搜索算法来搜索文档内
- 28. 网站搜索框和文档库的SharePoint 2013搜索结果
- 29. 如何在弹性搜索中搜索文档
- 30. App Engine搜索API(文档搜索) - 多种语言
那你试试这么远吗? – nmagerko 2012-01-13 02:59:52
我相信你可以找到一个答案[这里](http://stackoverflow.com/questions/881931/how-can-i-find-extended-ascii-characters-in-a-file-using-perl)? – Neilos 2012-01-13 03:11:36
我接受了数学咖啡,因为它超强 - 在记事本++中工作 – 2012-01-13 19:24:19