我需要制作一个程序,打印文本 文件中的字母频率,并将该频率与python中的另一个频率进行比较。python中的字母频率
到目前为止,我可以打印信件发生的次数,但我得到的百分比频率是错误的。我认为这是因为我需要我的程序通过删除所有空格和其他 字符来计算文件中只有 字母的数量。
def addLetter (x):
result = ord(x) - ord(a)
return result
#start of the main program
#prompt user for a file
while True:
speech = raw_input("Enter file name:")
wholeFile = open(speech, 'r+').read()
lowlet = wholeFile.lower()
letters= list(lowlet)
alpha = list('abcdefghijklmnopqrstuvwxyz')
n = len(letters)
f = float(n)
occurrences = {}
d = {}
#number of letters
for x in alpha:
occurrences[x] = letters.count(x)
d[x] =(occurrences[x])/f
for x in occurrences:
print x, occurrences[x], d[x]
这是输出
Enter file name:dems.txt
a 993 0.0687863674148
c 350 0.0242449431976
b 174 0.0120532003325
e 1406 0.0973954003879
d 430 0.0297866444999
g 219 0.015170407315
f 212 0.0146855084511
i 754 0.0522305347742
h 594 0.0411471321696
k 81 0.00561097256858
j 12 0.000831255195345
m 273 0.0189110556941
l 442 0.0306178996952
o 885 0.0613050706567
n 810 0.0561097256858
q 9 0.000623441396509
p 215 0.0148933222499
s 672 0.0465502909393
r 637 0.0441257966196
u 305 0.021127736215
t 1175 0.0813937378775
w 334 0.0231366029371
v 104 0.00720421169299
y 212 0.0146855084511
x 13 0.000900526461624
z 6 0.000415627597672
Enter file name:
程序可以打印在列,但我真的不知道如何显示在这里。
的频率“A”应该是0.0878
这是一个家庭作业吗? – 2011-02-28 23:42:22
您的“f”变量包含列表的总长度,而不是列表中的字母字符数。另外 - 不要使用SO来欺骗你的作业。如果你不自己学习,你永远不会学习它。 – 2011-02-28 23:43:44
是的,这是一个任务。我没有试图欺骗。我只是遇到了一个死路,需要一些指导。感谢你的帮助。 – SimplyZ 2011-03-01 02:19:55