Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
APLICACIONES EN LA INGENIERÍA
ACTIVIDAD 1 – CIFRADO POR SUSTITUCIÓN
ACTIVIDAD 2 – RELACIÓN DE LOS IDIOMAS
Nombre: Daniel
EEBE-Escola d’Enginyeria de
Barcelona Est
1
Índice
Actividad 1
1. Introducción………………………………………………………………………………………………….. Pág. 3
2. ¿Qué se ha utilizado para obtener el orden de frecuencias?............................. Pág. 3
3. Exposición comparativa…………………………………………………………………………………. Pág. 4
4. Tablas de frecuencia del patrón y texto a descifrar………………………………………… Pág. 6
5. Solución actividad 1………………………………………………………………………………………. Pág. 8
6. ¿Cómo se ha resuelto?..................................................................................... Pág. 9
Actividad 2
7. Introducción…………………………………………………………………………………………………. Pág. 10
8. ¿Qué se ha utilizado para obtener el orden de frecuencias en la actividad 2?...Pág. 10
9. Exposición comparativa………………………………………………………………………………….Pág. 11
10. Realización del super patrón………………………………………………………………………….Pág. 14
11. Representación gráfica de los super patrones enfrentados…………………………… Pág. 18
12. Conclusiones
12.1 Conclusiones actividad 1……………………………………………………….. Pág. 28
12.2 Conclusiones actividad 2……………………………………………………….. Pág. 28
2
ACTIVIDAD 1 – CIFRADO POR SUSTITUCIÓN
1. Introducción.
En esta propuesta haremos una aproximación a una de las primeras aplicaciones históricas de
la estadística: el cifrado por sustitución. Este sistema simple de cifrado se basa en cambiar
cada letra de un mensaje por otra convenida. La cuestión es que en un idioma cada letra tiene
una frecuencia característica, por tanto, la que la sustituya mantendrá esta frecuencia. Así
pues, inicialmente construiremos una plantilla de frecuencias para el catalán o castellano y la
utilizaremos para intentar descifrar un mensaje secreto (texto cifrado).
Hemos utilizado 5 textos en lengua castellana para obtener la plantilla de frecuencias de esta
lengua estudiada.
Los 5 textos son cuentos infantiles con una longitud mayor a 5000 caracteres sin tener en
cuenta los signos de puntuación, interrogación y exclamación.
3
3. Exposición comparativa
De cada uno de los textos obtenemos una plantilla de frecuencias relativas de cada texto que
deberá ser comparada en relación la plantilla de frecuencias absolutas (global). Para poder
comparar mejor las frecuencias emplearemos el grafico de Pareto.
Texto 1
Comparando podemos ver como el texto 1 y la frecuencia global siguen el mismo patrón.
Teniendo algunos picos de mayor uso en las letras ‘O’ y ’S’, pero sin interferir en el orden de
frecuencia obtenido.
Texto 2
4
Comparando vemos como hay un uso mayor de algunas de las letras, destacando ‘A’, que es
más utilizado que en la frecuencia absoluta. Debido que hay un uso mayor de otras letras en
este texto el orden de frecuencia vendría a ser diferente. Por ejemplo, se debería cambiar el
orden de alguna letra como la ‘R’ por la ‘S’ o a la ‘U’ por la ‘I’ entre otros.
Texto 3
Comparando vemos como hay un uso mayor de algunas de las letras, como la ‘O’, la ‘S’ y la ‘N’,
que son más utilizados que en la frecuencia absoluta. El orden de frecuencia simplemente
vendría diferenciado por el mayor uso de la letra ‘N’ en comparativa con la letra ‘R’
manteniendo el orden del resto de la frecuencia.
Texto 4
Comparando vemos como hay un uso mayor de algunas de las letras, destacando ‘E’, que es
más utilizado que en la frecuencia absoluta. Debido que hay un uso mayor de otras letras en
5
este texto el orden de frecuencia vendría a ser diferente. Por ejemplo, se debería cambiar el
orden de alguna letra como la ‘A’ por la ‘E’ o a la ‘N’ debería estar por delante de ‘S’ y ‘R’ entre
otros.
Texto 5
Comparando vemos como hay un uso mayor de algunas de las letras que son más utilizadas
que en la frecuencia absoluta. Debido que hay un uso mayor de otras letras en este texto el
orden de frecuencia vendría a ser diferente. Por ejemplo, se debería cambiar el orden de
alguna letra como la ‘L’ pasarla detrás de la ’I’, la ‘U’ y la ‘D’.
6
G 0,01285383 0,01439418 0,01583368 0,01078998 0,01238177 0,01086957
H 0,01218941 0,0113888 0,01032631 0,01387283 0,01186586 0,01349325
V 0,01204672 0,00933249 0,0086741 0,01361593 0,01530525 0,01330585
Y 0,01203165 0,01249605 0,01184084 0,01194605 0,0116939 0,01218141
J 0,0067441 0,00743436 0,00922484 0,00462428 0,00550301 0,00693403
F 0,00526264 0,00537804 0,00426821 0,0061657 0,00619089 0,00431034
Z 0,0047325 0,00474533 0,005232 0,00398202 0,00464316 0,00505997
Ñ 0,00208502 0,00189813 0,00371747 0,00166988 0,00051591 0,00262369
K 0,00073645 0,00079089 0,00289137 0 0 0
X 0,00071997 0,00126542 0,00068842 0,00077071 0,00068788 0,00018741
W 0,00022029 0 0,00110147 0 0 0
Tabla 2. Patrón de los 5 textos analizados con sus frecuencias relativas. Orden de mayor a menor frecuencia.
7
Figura 6. Diagrama de Pareto del texto a descifrar.
5. Solución actividad 1
Texto descifrado
A MEDIDA QUE CRECE EL PRODUCTO INTERIOR BRUTO GLOBAL DEL PLANETA CRECE
EL CONSUMO DE ENERGIA. PODEMOS GENERAR MUCHA RIQUEZA CUANDO TENEMOS
MUCHA ENERGIA. LA ENERGIA NO ES UNA MERCANCIA MAS. ES UN REQUISITO
INDISPENSABLE PARA PODER HACER TODAS LAS ACTIVIDADES DE LA SOCIEDAD
HUMANA. SI DIVIDIMOS TODA LA ENERGIA QUE SE CONSUME EN EL PLANETA
ENTRE SUS SIETE MIL MILLONES DE HABITANTES, NOS TOCAN DOS MIL
QUINIENTOS VATIOS POR PERSONA, CIFRA QUE EQUIVALE A TENER UN HORNO
MICROONDAS FUNCIONANDO TODAS LAS HORAS DEL DIA DURANTE UN AÑO. EL SER
HUMANO EQUIVALE A UNA MAQUINA DE UNOS CIEN VATIOS, Y PARA MANTENER
ESTA MAQUINA SE NECESITARIAN VEINTICINCO PERSONAS TRABAJANDO
CONSTANTEMENTE. EN EL CASO DE ESPAÑA Y DE CATALUÑA, LA NECESIDAD SUBE
HASTA CUARENTA Y CINCO DE ESTOS ESCLAVOS VIRTUALES ENERGETICOS.
Texto cifrado
x dhomox auh ebheh hr fbvoueqv mzqhbmvb jbuqv grvjxr ohr frxzhqx ebheh
hr evzwudv oh hzhbgmx. fvohdvw ghzhbxb dueyx bmauhtx euxzov qhzhdvw
dueyx hzhbgmx. rx hzhbgmx zv hw uzx dhbexzemx dxw. hw uz bhaumwmqv
mzomwfhzwxjrh fxbx fvohb yxehb qvoxw rxw xeqmkmoxohw oh rx wvemhoxo
yudxzx. wm omkmomdvw qvox rx hzhbgmx auh wh evzwudh hz hr frxzhqx
hzqbh wuw wmhqh dmr dmrrvzhw oh yxjmqxzqhw, zvw qvexz ovw dmr
aumzmhzqvw kxqmvw fvb fhbwvzx, emcbx auh haumkxrh x qhzhb uz yvbzv
dmebvvzoxw cuzemvzxzov qvoxw rxw yvbxw ohr omx oubxzqh uz xsv. hr whb
yudxzv haumkxrh x uzx dxaumzx oh uzvw emhz kxqmvw, l fxbx dxzqhzhb
hwqx dxaumzx wh zhehwmqxbmxz khmzqmemzev fhbwvzxw qbxjxixzov
evzwqxzqhdhzqh. hz hr exwv oh hwfxsx l oh exqxrusx, rx zhehwmoxo wujh
yxwqx euxbhzqx l emzev oh hwqvw hwerxkvw kmbquxrhw hzhbghqmevw.
8
6. ¿Cómo se ha resuelto?
Después de analizar y obtener el promedio del patrón obtenido de los 5 textos, se obtuvo el
patrón obtenido en el texto a descifrar. Con las frecuencias relativas del texto a descifrar
pudimos comparar y establecer una relación entre frecuencias del patrón de los 5 textos y el
obtenido con el texto misterioso. Una vez realizado los cambios pertinentes letra a letra se
intentaba dar algo de sentido lógico al texto, pero sin éxito. A través de diferentes cambios en
el patrón inicial obtuvimos el texto completo. A continuación, queda detallado todos los
cambios.
9
ACTIVIDAD 2 – RELACIÓN DE LOS IDIOMAS
7. Introducción
Hemos utilizado 5 textos en lengua inglesa para obtener la plantilla de frecuencias de esta
lengua estudiada.
Los 5 textos son cuentos infantiles con una longitud mayor a 5000 caracteres sin tener en
cuenta los signos de puntuación, interrogación y exclamación.
10
N 0,05006273 0,06518283 0,0590379 0,00707874 0,05321364 0,06580054
L 0,04371544 0,03828829 0,04854227 0,0467051 0,03812126 0,04692027
W 0,02960891 0,0381558 0,02463557 0,02678246 0,02641166 0,03205907
U 0,02802461 0,02225755 0,02361516 0,02940962 0,03044496 0,03439574
M 0,02649386 0,02239004 0,02142857 0,02809604 0,02485038 0,03570427
Y 0,0204647 0,01709062 0,01734694 0,01963074 0,02797294 0,02028227
G 0,02021396 0,01868045 0,01982507 0,02342553 0,01717408 0,02196467
F 0,02007587 0,01974033 0,01705539 0,01722251 0,01925579 0,02710534
C 0,01996503 0,01709062 0,02653061 0,02327957 0,01535259 0,01757174
B 0,01705459 0,00887652 0,01093294 0,0116033 0,02198803 0,03187214
P 0,01598302 0,01642819 0,01953353 0,01992264 0,01131928 0,01271147
K 0,01022126 0,00847907 0,0106414 0,00817339 0,0135311 0,01028133
V 0,00712006 0,01006889 0,00510204 0,00948697 0,00533437 0,005608
J 0,00107148 0,00039746 0,00087464 0,00153251 0,00143117 0,0011216
Q 0,00094609 0,00344462 0,00058309 0,00021893 0,00039032 9,3467E-05
X 0,00069205 0,00079491 0,00072886 0,0009487 0,00052043 0,00046733
Z 0,00054146 0,00026497 0 0,00175144 0,00013011 0,0005608
Tabla 6. Patrón de los 5 textos analizados con sus frecuencias relativas. Orden de mayor a menor frecuencia.
9. Exposición comparativa
De cada uno de los textos obtenemos una plantilla de frecuencias relativas de cada texto que
deberá ser comparada en relación la plantilla de frecuencias absolutas (global). Para poder
comparar mejor las frecuencias emplearemos el grafico de Pareto.
11
Figura 8. Diagrama de Pareto para comparar el Patrón y el texto 2.
12
Figura 10. Diagrama de Pareto para comparar el Patrón y el texto 4.
13
10. Realización del super patrón
14
Idioma Euskera Idioma Italiano
Texto 1 Wenjie Yin Texto 1 Yaolun Chen
Texto 2 Sergi Lopez Massana Texto 2 Gerard Albujer
Texto 3 Francesc de Paula Oliveras Texto 3 Javier Andres Belmonte
Texto 4 Bisnú Masó Texto 4 Joan torrent
Super Patrón Promedio Super Patrón Promedio
A 0,156545 E 0,11770227
E 0,127229 I 0,11494675
I 0,089061 A 0,10920092
R 0,078964 O 0,0918611
N 0,077431 N 0,07134407
T 0,074360 T 0,0664471
O 0,054261 R 0,0646984
K 0,051345 L 0,06469837
U 0,049618 S 0,05039316
Z 0,046541 C 0,04586203
D 0,032796 D 0,03881496
L 0,030725 U 0,03092476
B 0,027844 P 0,02846022
S 0,027094 M 0,0269196
G 0,024214 G 0,01691903
H 0,016909 V 0,01655861
M 0,012450 F 0,01098528
P 0,009574 H 0,00977384
F 0,003909 Z 0,00943978
J 0,003435 B 0,00893612
X 0,003059 Q 0,00394918
C 0,001108 K 0,00034705
V 0,000788 W 0,00031942
Y 0,000418 X 0,00024577
W 0,000277 Y 0,0001778
Q 0,000049 J 7,4398E-05
Tabla 9. Super patrón euskera. Tabla 10. Super patrón italiano
15
Idioma Francés Idioma Alemán
Texto 1 Oscar Manzanera Texto 1 Luis Lopez
Texto 2 Roger Acin Texto 2 Víctor Manuel Díaz
Texto 3 Bisnú Masó Texto 3 Mohamed El Madani
Texto 4 Ericka Idrach Texto 4 Jordi Giménez
Super Patrón Promedio Super Patrón Promedio
E 0,1729 E 0,16733041
S 0,0801 S 0,11614857
A 0,0783 N 0,09905054
N 0,0767 I 0,0798409
I 0,0740 T 0,06330068
T 0,0729 A 0,05912138
R 0,0676 H 0,0478552
L 0,0577 D 0,04653986
U 0,0576 U 0,04391144
O 0,0565 L 0,03852975
D 0,0399 R 0,03676485
C 0,0347 C 0,03042301
M 0,0284 M 0,02861467
P 0,0279 G 0,02746881
V 0,0127 P 0,0191669
F 0,0120 B 0,01901599
G 0,0109 F 0,0172293
Q 0,0098 K 0,01698501
H 0,0082 W 0,01574883
B 0,0080 O 0,01568789
X 0,0037 Z 0,01101637
J 0,0036 V 0,00865168
Y 0,0032 Q 0,0037426
K 0,0010 J 0,0021855
Z 0,0010 Y 0,0018437
W 0,0009 X 0,00075775
Tabla 11. Super patrón francés. Tabla 12. Super patrón alemán.
16
Idioma Inglés Idioma Portugués
Texto 1 Daniel Navas Texto 1 Yassin el Metioui
Texto 2 Noelia Díaz Texto 2 Ana Verónica Maciel
Texto 3 Pau Rodrigo Texto 3 Asier Naranjo
Texto 4 Oscar Fius Texto 4 Marc Gamonal
Super Patrón Promedio Super Patrón Promedio
E 0,12561129 A 0,1334
T 0,09488917 E 0,1234
A 0,08413368 O 0,1096
O 0,07623348 S 0,0793
I 0,07034375 R 0,0693
N 0,06484148 I 0,0678
S 0,06335899 D 0,0540
R 0,05752209 N 0,0522
H 0,05677903 T 0,0490
L 0,04338807 M 0,0445
D 0,04211593 C 0,0417
C 0,02916819 U 0,0415
U 0,02705046 L 0,0291
M 0,02399772 P 0,0285
G 0,02263037 V 0,0142
F 0,02131122 G 0,0126
W 0,02092274 F 0,0105
P 0,01954799 B 0,0102
Y 0,01817806 H 0,0093
B 0,01556454 Q 0,0088
V 0,00936014 Z 0,0037
K 0,00828553 J 0,0033
X 0,00150346 X 0,0028
Q 0,00121998 K 0,0005
J 0,00109957 W 0,0004
Z 0,00094307 Y 0,0003
Tabla 13. Super patrón inglés. Tabla 14. Super patrón portugués.
17
11. Representación gráfica de los super patrones enfrentados
Figura 12.
Figura 13.
18
Figura 14.
Figura 15.
Figura 16.
19
Figura 17.
Figura 18.
Figura 19.
20
Figura 20.
Figura 21.
Figura 22.
21
Figura 23.
Figura 24.
Figura 25.
22
Figura 26.
Figura 27.
Figura 28.
23
Figura 29.
Figura 30.
Figura 32.
24
Figura 31.
Figura 33.
Figura 34.
25
Figura 35.
Figura 36.
Figura 37.
26
Figura 38.
Figura 39.
27
12. Conclusiones
12.1. Conclusiones actividad 1
Apreciamos que el alemán junto el euskera son las lenguas con menos semejanzas ortográficas
tienen con el resto de las lenguas siendo todo rojo, menos el caso de alemán-francés que se
encuentra en amarillo. Esto puede ser debido a la cercanía entre los dos países.
Vemos que la relación alemán-euskera es el valor mas pequeño de similitud entre dos de las
lenguas estudiadas.
La gran mayoría de casos en amarillo, excepto la inglesa, son debidos a que provienen de
lenguas romances, es decir, tienen un pasado común. Por lo que sucede con la lengua inglesa
el color amarillo puede ser debido a los anglicismos actuales.
28