Si vols recuperar un text xifrat amb el xifratge de substitució, pots utilitzar l'anàlisi de freqüències. En altres paraules, si s'ha intentat ocultar cada lletra substituint-la per una altra de diferent, encara podràs reconèixer les lletres originals, perquè les característiques freqüencials de les lletres originals passen directament a les noves.

Per aplicar l'anàlisi de freqüències, necessitem saber la freqüència amb què cada lletra de l'alfabet apareix en català o en la llengua en què estigui escrit el text original.

A continuació es mostra una llista de les freqüències amb què cada lletra de l'alfabet apareix en català. Per exemple, un 13,89 % de les lletres d'un text normal correspon a la lletra E, mentre que la Z apareix només un 0,01 %. Juntament amb la taula de freqüències, es pot veure també la seva representació gràfica.

  


Font: Institut d'Estudis Catalans



Observa que les freqüències tabulades són freqüències mitjanes. Així, la E no sempre apareixerà un 13,89 % del total de lletres en un text, i fins i tot podria passar que la E no fos la lletra més freqüent. Com més llarg sigui el missatge, més s'assemblaran les freqüències a les que es mostren a la taula. De totes maneres, aquesta regla té excepcions. El 1969 l'autor francès Georges Perec va escriure un llibre de 20 pàgines titulat La disparition, en el qual no apareix cap paraula amb la lletra E. Sorprenentment, el llibre ha estat traduït a diversos idiomes. A la versió castellana, deguda a M. Arbués, M. Burrel, M. Parayre, R. Vega i H. Salceda, El secuestro, la lletra desapareguda és la A.

 
Pots provar la distribució de freqüència de les lletres d'un fragment de text escrivint-lo en el requadre inferior. N'hi ha prou que tallis i enganxis un fragment de text extret, per exemple, d'un document de treball o del web. A continuació prem el botó "Calcular freqüències de lletres".

Si s'analitza una sola frase, la distribució de freqüències resultant serà una mica diferent de la que es mostra a dalt. El mateix passarà si el text introduït no està escrit en català. Malgrat això, si el text és prou llarg, serà igual que es tracti d'un fragment de Cervantes que d'una notícia d'un diari: en tots dos casos, el resultat s'assemblarà molt.