2017-01-23 51 views
0

我想知道是否有方法在文本文件中查找(并显示)所有唯一字(出现一次的字)?这可以通过使用命令行来完成吗?或者我会不得不使用类似python脚本的东西?文本文件中的唯一字

+0

你也可以试试这个[link](http://stackoverflow.com/questions/22978602/how-to-return-unique-words-from-the-text-file-using-python) –

回答

0

如果您不想编写应用程序,那么我可以想到的最简单的方法就是使用powershell。看到这一点:

https://msdn.microsoft.com/en-us/powershell/reference/5.1/microsoft.powershell.utility/get-unique

Microsoft提供的例子填充一个变量的独特单词列表:

$A = $(foreach ($line in Get-Content C:\Test1\File1.txt) {$line.tolower().split(" ")}) | sort | Get-Unique 

你可能希望使用更多的分隔符,虽然拆就标点符号像这样:

$A = $(foreach ($line in Get-Content C:\test.txt) {$line.tolower().split(" .,?!;:")}) | sort | Get-Unique 

将其放在一个扩展名为.ps1的文件中,您可以从命令行运行它。为了获得这些值出的变量只是变量第二行以呼应结果到屏幕上:

$A 

为了获得项目的数组中的数,你可以这样做:

$A.count 
+0

这工作完美!非常感谢! –

+0

没问题。对于像这样的简单任务,PowerShell是完美的。拼凑一个小脚本比编写需要编译的应用程序要快。 – tonythewest

+0

有没有办法忽略标点符号? –

相关问题