Frequency Analysis on Course Blog

By Jeremy Greene

 

So I did a frequency analysis on the course blog. I used all the text on the page including the words in the margins. Here is the frequency breakdown:

 

Again, notice that ‘e’ has the highest frequency and then ‘t’ follows. Following closely behind are ‘s’ and ‘n’ again.

 

9990 chars

a : 621 ... 6.2 %
b : 148 ... 1.5 %
c : 321 ... 3.2 %
d : 321 ... 3.2 %
e : 1090 ... 10.9 %
f : 155 ... 1.6 %
g : 237 ... 2.4 %
h : 373 ... 3.7 %
i : 606 ... 6.1 %
j : 10 ... 0.1 %
k : 96 ... 1.0 %
l : 335 ... 3.4 %
m : 286 ... 2.9 %
n : 596 ... 6.0 %
o : 708 ... 7.1 %
p : 293 ... 2.9 %
q : 17 ... 0.2 %
r : 520 ... 5.2 %
s : 635 ... 6.4 %
t : 826 ... 8.3 %
u : 319 ... 3.2 %
v : 120 ... 1.2 %
w : 190 ... 1.9 %
x : 26 ... 0.3 %
y : 283 ... 2.8 %
z : 18 ... 0.2 %

Letter frequencies


e : 1090
t : 826
o : 708
s : 635
a : 621
i : 606
n : 596
r : 520
h : 373
l : 335
c : 321
d : 321
u : 319
p : 293
m : 286
y : 283
g : 237
w : 190
f : 155
b : 148
v : 120
k : 96
x : 26
z : 18
q : 17
j : 10