Sei sulla pagina 1di 28

AMPLIACIÓN DE ESTADÍSTICA Y

APLICACIONES EN LA INGENIERÍA
ACTIVIDAD 1 – CIFRADO POR SUSTITUCIÓN
ACTIVIDAD 2 – RELACIÓN DE LOS IDIOMAS

Nombre: Daniel

Apellidos: Navas Garrido

Profesor: Pablo Buenestado

Fecha entrega: 02/10/2019

EEBE-Escola d’Enginyeria de
Barcelona Est

1
Índice
Actividad 1
1. Introducción………………………………………………………………………………………………….. Pág. 3
2. ¿Qué se ha utilizado para obtener el orden de frecuencias?............................. Pág. 3
3. Exposición comparativa…………………………………………………………………………………. Pág. 4
4. Tablas de frecuencia del patrón y texto a descifrar………………………………………… Pág. 6
5. Solución actividad 1………………………………………………………………………………………. Pág. 8
6. ¿Cómo se ha resuelto?..................................................................................... Pág. 9

Actividad 2
7. Introducción…………………………………………………………………………………………………. Pág. 10
8. ¿Qué se ha utilizado para obtener el orden de frecuencias en la actividad 2?...Pág. 10
9. Exposición comparativa………………………………………………………………………………….Pág. 11
10. Realización del super patrón………………………………………………………………………….Pág. 14
11. Representación gráfica de los super patrones enfrentados…………………………… Pág. 18
12. Conclusiones
12.1 Conclusiones actividad 1……………………………………………………….. Pág. 28
12.2 Conclusiones actividad 2……………………………………………………….. Pág. 28

2
ACTIVIDAD 1 – CIFRADO POR SUSTITUCIÓN

1. Introducción.

En esta propuesta haremos una aproximación a una de las primeras aplicaciones históricas de
la estadística: el cifrado por sustitución. Este sistema simple de cifrado se basa en cambiar
cada letra de un mensaje por otra convenida. La cuestión es que en un idioma cada letra tiene
una frecuencia característica, por tanto, la que la sustituya mantendrá esta frecuencia. Así
pues, inicialmente construiremos una plantilla de frecuencias para el catalán o castellano y la
utilizaremos para intentar descifrar un mensaje secreto (texto cifrado).

2. ¿Qué se ha utilizado para obtener el orden de frecuencias?

Hemos utilizado 5 textos en lengua castellana para obtener la plantilla de frecuencias de esta
lengua estudiada.

Los 5 textos son cuentos infantiles con una longitud mayor a 5000 caracteres sin tener en
cuenta los signos de puntuación, interrogación y exclamación.

A continuación, toda la información esta detallada en la tabla:

Texto ¿Qué es? nº caracteres Bibliografía


cuento https://www.mundoprimaria.com/cuentos-infantiles-
texto 1 infantil 6322 cortos/cuentos-populares/manchas-jaguar
cuento https://www.mundoprimaria.com/cuentos-infantiles-
texto 2 infantil 7263 cortos/cuentos-populares/kuta-tortuga-inteligente
cuento https://www.mundoprimaria.com/fabulas-para-
texto 3 infantil 7785 ninos/tres-ciegos-elefante
cuento https://www.mundoprimaria.com/cuentos-infantiles-
texto 4 infantil 5815 cortos/chico-fue-buscar-al-viento-del-norte
cuento https://www.mundoprimaria.com/cuentos-infantiles-
texto 5 infantil 5336 cortos/el-pez-de-oro
Tabla 1. Información de los textos seleccionados.

3
3. Exposición comparativa

De cada uno de los textos obtenemos una plantilla de frecuencias relativas de cada texto que
deberá ser comparada en relación la plantilla de frecuencias absolutas (global). Para poder
comparar mejor las frecuencias emplearemos el grafico de Pareto.

Texto 1

Figura 1. Diagrama de Pareto para comparar el Patrón y el texto 1.

Comparando podemos ver como el texto 1 y la frecuencia global siguen el mismo patrón.
Teniendo algunos picos de mayor uso en las letras ‘O’ y ’S’, pero sin interferir en el orden de
frecuencia obtenido.

Texto 2

Figura 2. Diagrama de Pareto para comparar el Patrón y el texto 2.

4
Comparando vemos como hay un uso mayor de algunas de las letras, destacando ‘A’, que es
más utilizado que en la frecuencia absoluta. Debido que hay un uso mayor de otras letras en
este texto el orden de frecuencia vendría a ser diferente. Por ejemplo, se debería cambiar el
orden de alguna letra como la ‘R’ por la ‘S’ o a la ‘U’ por la ‘I’ entre otros.

Texto 3

Figura 3. Diagrama de Pareto para comparar el Patrón y el texto 3.

Comparando vemos como hay un uso mayor de algunas de las letras, como la ‘O’, la ‘S’ y la ‘N’,
que son más utilizados que en la frecuencia absoluta. El orden de frecuencia simplemente
vendría diferenciado por el mayor uso de la letra ‘N’ en comparativa con la letra ‘R’
manteniendo el orden del resto de la frecuencia.

Texto 4

Figura 4. Diagrama de Pareto para comparar el Patrón y el texto 4.

Comparando vemos como hay un uso mayor de algunas de las letras, destacando ‘E’, que es
más utilizado que en la frecuencia absoluta. Debido que hay un uso mayor de otras letras en

5
este texto el orden de frecuencia vendría a ser diferente. Por ejemplo, se debería cambiar el
orden de alguna letra como la ‘A’ por la ‘E’ o a la ‘N’ debería estar por delante de ‘S’ y ‘R’ entre
otros.

Texto 5

Figura 5. Diagrama de Pareto para comparar el Patrón y el texto 5.

Comparando vemos como hay un uso mayor de algunas de las letras que son más utilizadas
que en la frecuencia absoluta. Debido que hay un uso mayor de otras letras en este texto el
orden de frecuencia vendría a ser diferente. Por ejemplo, se debería cambiar el orden de
alguna letra como la ‘L’ pasarla detrás de la ’I’, la ‘U’ y la ‘D’.

4. Tablas de frecuencia del patrón y texto a descifrar.

Promedio texto 1 texto 2 texto 3 texto 4 texto 5


A 0,13108867 0,12954761 0,14387994 0,12280026 0,12072227 0,13849325
E 0,12943631 0,12337868 0,12625637 0,12344252 0,14067068 0,13343328
O 0,09375382 0,09917748 0,08701638 0,10186256 0,09544282 0,08526987
S 0,07424144 0,08161974 0,06829134 0,08362235 0,06758383 0,07008996
R 0,07039981 0,06991458 0,07779155 0,07180475 0,06689596 0,0655922
N 0,06642925 0,06010756 0,06787829 0,07373154 0,06895959 0,06146927
L 0,05163827 0,05346409 0,05011703 0,05150931 0,05606191 0,04703898
I 0,04930914 0,04966783 0,04337051 0,05138086 0,05021496 0,05191154
U 0,04721264 0,04808605 0,04818945 0,0480411 0,04058469 0,05116192
D 0,04522757 0,04808605 0,03731241 0,04149004 0,04677558 0,05247376
T 0,04324045 0,03954445 0,04763872 0,04007707 0,04677558 0,04216642
C 0,03916889 0,03717178 0,03868925 0,03994862 0,04161651 0,03841829
M 0,0311316 0,03179374 0,03180504 0,02697495 0,03697334 0,02811094
P 0,02865583 0,0313192 0,02946441 0,02607579 0,02493551 0,03148426
B 0,01564143 0,01502689 0,0165221 0,01695568 0,01358555 0,01611694
Q 0,0138023 0,01297058 0,01197852 0,01284522 0,01341359 0,0178036

6
G 0,01285383 0,01439418 0,01583368 0,01078998 0,01238177 0,01086957
H 0,01218941 0,0113888 0,01032631 0,01387283 0,01186586 0,01349325
V 0,01204672 0,00933249 0,0086741 0,01361593 0,01530525 0,01330585
Y 0,01203165 0,01249605 0,01184084 0,01194605 0,0116939 0,01218141
J 0,0067441 0,00743436 0,00922484 0,00462428 0,00550301 0,00693403
F 0,00526264 0,00537804 0,00426821 0,0061657 0,00619089 0,00431034
Z 0,0047325 0,00474533 0,005232 0,00398202 0,00464316 0,00505997
Ñ 0,00208502 0,00189813 0,00371747 0,00166988 0,00051591 0,00262369
K 0,00073645 0,00079089 0,00289137 0 0 0
X 0,00071997 0,00126542 0,00068842 0,00077071 0,00068788 0,00018741
W 0,00022029 0 0,00110147 0 0 0
Tabla 2. Patrón de los 5 textos analizados con sus frecuencias relativas. Orden de mayor a menor frecuencia.

N.º caracteres Frecuencia


A 10 0,01515152
B 36 0,05454545
C 2 0,0030303
D 20 0,03030303
E 32 0,04848485
F 12 0,01818182
G 7 0,01060606
H 92 0,13939394
I 1 0,00151515
J 6 0,00909091
K 9 0,01363636
L 3 0,00454545
M 47 0,07121212
N 0 0
Ñ 0 0
O 33 0,05
P 0 0
Q 35 0,0530303
R 27 0,04090909
S 3 0,00454545
T 1 0,00151515
U 32 0,04848485
V 48 0,07272727
W 51 0,07727273
X 85 0,12878788
Y 9 0,01363636
Z 59 0,08939394
Tabla 3. Patrón del texto a descifrar con su frecuencia relativa. Orden alfabético de la A-Z.

7
Figura 6. Diagrama de Pareto del texto a descifrar.

5. Solución actividad 1

Texto descifrado
A MEDIDA QUE CRECE EL PRODUCTO INTERIOR BRUTO GLOBAL DEL PLANETA CRECE
EL CONSUMO DE ENERGIA. PODEMOS GENERAR MUCHA RIQUEZA CUANDO TENEMOS
MUCHA ENERGIA. LA ENERGIA NO ES UNA MERCANCIA MAS. ES UN REQUISITO
INDISPENSABLE PARA PODER HACER TODAS LAS ACTIVIDADES DE LA SOCIEDAD
HUMANA. SI DIVIDIMOS TODA LA ENERGIA QUE SE CONSUME EN EL PLANETA
ENTRE SUS SIETE MIL MILLONES DE HABITANTES, NOS TOCAN DOS MIL
QUINIENTOS VATIOS POR PERSONA, CIFRA QUE EQUIVALE A TENER UN HORNO
MICROONDAS FUNCIONANDO TODAS LAS HORAS DEL DIA DURANTE UN AÑO. EL SER
HUMANO EQUIVALE A UNA MAQUINA DE UNOS CIEN VATIOS, Y PARA MANTENER
ESTA MAQUINA SE NECESITARIAN VEINTICINCO PERSONAS TRABAJANDO
CONSTANTEMENTE. EN EL CASO DE ESPAÑA Y DE CATALUÑA, LA NECESIDAD SUBE
HASTA CUARENTA Y CINCO DE ESTOS ESCLAVOS VIRTUALES ENERGETICOS.

Texto cifrado
x dhomox auh ebheh hr fbvoueqv mzqhbmvb jbuqv grvjxr ohr frxzhqx ebheh
hr evzwudv oh hzhbgmx. fvohdvw ghzhbxb dueyx bmauhtx euxzov qhzhdvw
dueyx hzhbgmx. rx hzhbgmx zv hw uzx dhbexzemx dxw. hw uz bhaumwmqv
mzomwfhzwxjrh fxbx fvohb yxehb qvoxw rxw xeqmkmoxohw oh rx wvemhoxo
yudxzx. wm omkmomdvw qvox rx hzhbgmx auh wh evzwudh hz hr frxzhqx
hzqbh wuw wmhqh dmr dmrrvzhw oh yxjmqxzqhw, zvw qvexz ovw dmr
aumzmhzqvw kxqmvw fvb fhbwvzx, emcbx auh haumkxrh x qhzhb uz yvbzv
dmebvvzoxw cuzemvzxzov qvoxw rxw yvbxw ohr omx oubxzqh uz xsv. hr whb
yudxzv haumkxrh x uzx dxaumzx oh uzvw emhz kxqmvw, l fxbx dxzqhzhb
hwqx dxaumzx wh zhehwmqxbmxz khmzqmemzev fhbwvzxw qbxjxixzov
evzwqxzqhdhzqh. hz hr exwv oh hwfxsx l oh exqxrusx, rx zhehwmoxo wujh
yxwqx euxbhzqx l emzev oh hwqvw hwerxkvw kmbquxrhw hzhbghqmevw.

8
6. ¿Cómo se ha resuelto?

Después de analizar y obtener el promedio del patrón obtenido de los 5 textos, se obtuvo el
patrón obtenido en el texto a descifrar. Con las frecuencias relativas del texto a descifrar
pudimos comparar y establecer una relación entre frecuencias del patrón de los 5 textos y el
obtenido con el texto misterioso. Una vez realizado los cambios pertinentes letra a letra se
intentaba dar algo de sentido lógico al texto, pero sin éxito. A través de diferentes cambios en
el patrón inicial obtuvimos el texto completo. A continuación, queda detallado todos los
cambios.

Patrón Frecuencia Decodificación Solución final


H 0,13939394 A E
X 0,12878788 E A
Z 0,08939394 O N
W 0,07727273 S S
V 0,07272727 R O
M 0,07121212 N I
B 0,05454545 L R
Q 0,0530303 I T
O 0,05 U D
E 0,04848485 D C
U 0,04848485 T U
R 0,04090909 C L
D 0,03030303 M M
F 0,01818182 P P
A 0,01515152 B Q
K 0,01363636 Q V
Y 0,01363636 G H
G 0,01060606 H G
J 0,00909091 V B
L 0,00454545 Y V
S 0,00454545 J Ñ
C 0,0030303 F F
I 0,00151515 Z Z
T 0,00151515 Ñ J
N 0 K K
Ñ 0 X X
P 0 W W
Tabla 4. Patrón del texto a descifrar con su frecuencia relativa, comparativa con nuestro patrón y cambio de
nuestro patrón. Ordenado mayor a menor.

9
ACTIVIDAD 2 – RELACIÓN DE LOS IDIOMAS

7. Introducción

Imitando la construcción realizada en la actividad 1 sobre la distribución de frecuencias de los


alfabetos catalán y castellano, repetimos el proceso para otros idiomas y evaluamos la afinidad
entre ellos. A partir de la distribución de frecuencias de cada alfabeto intentamos demostrar la
existencia de un perfil característico para cada idioma. Los idiomas a estudiar son: alemán,
castellano, catalán, euskera, francés, inglés, italiano y portugués.

8. ¿Qué se ha utilizado para obtener el orden de frecuencias en la actividad 2?

Hemos utilizado 5 textos en lengua inglesa para obtener la plantilla de frecuencias de esta
lengua estudiada.

Los 5 textos son cuentos infantiles con una longitud mayor a 5000 caracteres sin tener en
cuenta los signos de puntuación, interrogación y exclamación.

A continuación, toda la información esta detallada en la tabla:

Texto ¿Qué es? nº caracteres Bibliografía


cuento https://www.storiestogrowby.org/story/snow-white-
texto 1 infantil 7548 and-the-seven-dwarfs-bedtime-stories-for-kids/
cuento https://www.storiestogrowby.org/story/cinderella-fairy-
texto 2 infantil 6860 tale-english-story-for-kids/
https://www.storiestogrowby.org/story/aladdin-story-
cuento from-the-arabian-nights-bedtime-stories-folk-tales-for-
texto 3 infantil 13703 kids/
cuento https://www.storiestogrowby.org/story/early-reader-
texto 4 infantil 7686 beauty-beast-english-story-kids/
cuento https://www.storiestogrowby.org/story/bambi-life-
texto 5 infantil 11609 woods-bedtime-story/
Tabla 5. Información de los textos seleccionados.

Promedio texto 1 texto 2 texto 3 texto 4 texto 5


E 0,13370561 0,13804981 0,13367347 0,13004452 0,13244861 0,13431162
T 0,09250823 0,08969263 0,09081633 0,09589141 0,09575852 0,09038228
A 0,0851649 0,07882883 0,07332362 0,0955995 0,09055425 0,0875183
O 0,07963545 0,07710652 0,08338192 0,07443625 0,07754359 0,08570894
H 0,07186722 0,07472178 0,06851312 0,07509305 0,07090814 0,07010001
I 0,06540413 0,05935347 0,07157434 0,07356053 0,05906844 0,06346388
S 0,06525014 0,06968733 0,06049563 0,06516821 0,06687484 0,06402468
R 0,05710338 0,05710122 0,05612245 0,05597314 0,05360396 0,06271614
D 0,05262801 0,04782724 0,05568513 0,05896519 0,04579755 0,05486494

10
N 0,05006273 0,06518283 0,0590379 0,00707874 0,05321364 0,06580054
L 0,04371544 0,03828829 0,04854227 0,0467051 0,03812126 0,04692027
W 0,02960891 0,0381558 0,02463557 0,02678246 0,02641166 0,03205907
U 0,02802461 0,02225755 0,02361516 0,02940962 0,03044496 0,03439574
M 0,02649386 0,02239004 0,02142857 0,02809604 0,02485038 0,03570427
Y 0,0204647 0,01709062 0,01734694 0,01963074 0,02797294 0,02028227
G 0,02021396 0,01868045 0,01982507 0,02342553 0,01717408 0,02196467
F 0,02007587 0,01974033 0,01705539 0,01722251 0,01925579 0,02710534
C 0,01996503 0,01709062 0,02653061 0,02327957 0,01535259 0,01757174
B 0,01705459 0,00887652 0,01093294 0,0116033 0,02198803 0,03187214
P 0,01598302 0,01642819 0,01953353 0,01992264 0,01131928 0,01271147
K 0,01022126 0,00847907 0,0106414 0,00817339 0,0135311 0,01028133
V 0,00712006 0,01006889 0,00510204 0,00948697 0,00533437 0,005608
J 0,00107148 0,00039746 0,00087464 0,00153251 0,00143117 0,0011216
Q 0,00094609 0,00344462 0,00058309 0,00021893 0,00039032 9,3467E-05
X 0,00069205 0,00079491 0,00072886 0,0009487 0,00052043 0,00046733
Z 0,00054146 0,00026497 0 0,00175144 0,00013011 0,0005608
Tabla 6. Patrón de los 5 textos analizados con sus frecuencias relativas. Orden de mayor a menor frecuencia.

9. Exposición comparativa

De cada uno de los textos obtenemos una plantilla de frecuencias relativas de cada texto que
deberá ser comparada en relación la plantilla de frecuencias absolutas (global). Para poder
comparar mejor las frecuencias emplearemos el grafico de Pareto.

Figura 7. Diagrama de Pareto para comparar el Patrón y el texto 1.

11
Figura 8. Diagrama de Pareto para comparar el Patrón y el texto 2.

Figura 9. Diagrama de Pareto para comparar el Patrón y el texto 3.

12
Figura 10. Diagrama de Pareto para comparar el Patrón y el texto 4.

Figura 11. Diagrama de Pareto para comparar el Patrón y el texto 5.

13
10. Realización del super patrón

Idioma Catalán Idioma Castellano


Texto 1 Bisnú Masó Texto 1 Noelia Díaz
Texto 2 Ericka Idrach Texto 2 Daniel Navas
Texto 3 Nack Finja Texto 3 Oscar Manzanera
Texto 4 Renato Luis Tome Texto 4 Yassine El Metioui
Super Patrón Promedio Super Patrón Promedio
E 0,137440 E 0,13115791
A 0,127633 A 0,12577797
S 0,078127 O 0,09093342
I 0,072413 S 0,07400541
R 0,071404 N 0,07139841
L 0,065508 I 0,06660688
N 0,065471 R 0,06467555
T 0,060678 L 0,05646676
O 0,055922 D 0,04989751
U 0,041127 C 0,04642519
C 0,040660 T 0,04353837
D 0,039725 U 0,04203809
M 0,031533 M 0,02924911
P 0,028384 P 0,02646355
V 0,016644 B 0,01336023
B 0,013776 G 0,01120838
Q 0,012704 Q 0,01008295
G 0,012226 Y 0,00995921
F 0,010148 V 0,00927871
H 0,006366 H 0,00875507
X 0,004794 F 0,00792692
J 0,003059 J 0,00459302
Y 0,002609 Z 0,00391695
Z 0,001377 X 0,0016032
K 0,000173 K 0,0004495
W 0,000099 W 0,00023171
Tabla 7. Super patrón catalán. Tabla 8. Super patrón castellano.

14
Idioma Euskera Idioma Italiano
Texto 1 Wenjie Yin Texto 1 Yaolun Chen
Texto 2 Sergi Lopez Massana Texto 2 Gerard Albujer
Texto 3 Francesc de Paula Oliveras Texto 3 Javier Andres Belmonte
Texto 4 Bisnú Masó Texto 4 Joan torrent
Super Patrón Promedio Super Patrón Promedio
A 0,156545 E 0,11770227
E 0,127229 I 0,11494675
I 0,089061 A 0,10920092
R 0,078964 O 0,0918611
N 0,077431 N 0,07134407
T 0,074360 T 0,0664471
O 0,054261 R 0,0646984
K 0,051345 L 0,06469837
U 0,049618 S 0,05039316
Z 0,046541 C 0,04586203
D 0,032796 D 0,03881496
L 0,030725 U 0,03092476
B 0,027844 P 0,02846022
S 0,027094 M 0,0269196
G 0,024214 G 0,01691903
H 0,016909 V 0,01655861
M 0,012450 F 0,01098528
P 0,009574 H 0,00977384
F 0,003909 Z 0,00943978
J 0,003435 B 0,00893612
X 0,003059 Q 0,00394918
C 0,001108 K 0,00034705
V 0,000788 W 0,00031942
Y 0,000418 X 0,00024577
W 0,000277 Y 0,0001778
Q 0,000049 J 7,4398E-05
Tabla 9. Super patrón euskera. Tabla 10. Super patrón italiano

15
Idioma Francés Idioma Alemán
Texto 1 Oscar Manzanera Texto 1 Luis Lopez
Texto 2 Roger Acin Texto 2 Víctor Manuel Díaz
Texto 3 Bisnú Masó Texto 3 Mohamed El Madani
Texto 4 Ericka Idrach Texto 4 Jordi Giménez
Super Patrón Promedio Super Patrón Promedio
E 0,1729 E 0,16733041
S 0,0801 S 0,11614857
A 0,0783 N 0,09905054
N 0,0767 I 0,0798409
I 0,0740 T 0,06330068
T 0,0729 A 0,05912138
R 0,0676 H 0,0478552
L 0,0577 D 0,04653986
U 0,0576 U 0,04391144
O 0,0565 L 0,03852975
D 0,0399 R 0,03676485
C 0,0347 C 0,03042301
M 0,0284 M 0,02861467
P 0,0279 G 0,02746881
V 0,0127 P 0,0191669
F 0,0120 B 0,01901599
G 0,0109 F 0,0172293
Q 0,0098 K 0,01698501
H 0,0082 W 0,01574883
B 0,0080 O 0,01568789
X 0,0037 Z 0,01101637
J 0,0036 V 0,00865168
Y 0,0032 Q 0,0037426
K 0,0010 J 0,0021855
Z 0,0010 Y 0,0018437
W 0,0009 X 0,00075775
Tabla 11. Super patrón francés. Tabla 12. Super patrón alemán.

16
Idioma Inglés Idioma Portugués
Texto 1 Daniel Navas Texto 1 Yassin el Metioui
Texto 2 Noelia Díaz Texto 2 Ana Verónica Maciel
Texto 3 Pau Rodrigo Texto 3 Asier Naranjo
Texto 4 Oscar Fius Texto 4 Marc Gamonal
Super Patrón Promedio Super Patrón Promedio
E 0,12561129 A 0,1334
T 0,09488917 E 0,1234
A 0,08413368 O 0,1096
O 0,07623348 S 0,0793
I 0,07034375 R 0,0693
N 0,06484148 I 0,0678
S 0,06335899 D 0,0540
R 0,05752209 N 0,0522
H 0,05677903 T 0,0490
L 0,04338807 M 0,0445
D 0,04211593 C 0,0417
C 0,02916819 U 0,0415
U 0,02705046 L 0,0291
M 0,02399772 P 0,0285
G 0,02263037 V 0,0142
F 0,02131122 G 0,0126
W 0,02092274 F 0,0105
P 0,01954799 B 0,0102
Y 0,01817806 H 0,0093
B 0,01556454 Q 0,0088
V 0,00936014 Z 0,0037
K 0,00828553 J 0,0033
X 0,00150346 X 0,0028
Q 0,00121998 K 0,0005
J 0,00109957 W 0,0004
Z 0,00094307 Y 0,0003
Tabla 13. Super patrón inglés. Tabla 14. Super patrón portugués.

17
11. Representación gráfica de los super patrones enfrentados

Figura 12.

Figura 13.

18
Figura 14.

Figura 15.

Figura 16.

19
Figura 17.

Figura 18.

Figura 19.

20
Figura 20.

Figura 21.

Figura 22.

21
Figura 23.

Figura 24.

Figura 25.

22
Figura 26.

Figura 27.

Figura 28.

23
Figura 29.

Figura 30.

Figura 32.

24
Figura 31.

Figura 33.

Figura 34.

25
Figura 35.

Figura 36.

Figura 37.

26
Figura 38.

Figura 39.

Alemán Castellano Catalán Euskera Francés Inglés Italiano Portugués


Alemán
Castellano 0,5681
Catalán 0,6464 0,9435
Euskera 0,4272 0,6608 0,6947
Francés 0,8026 0,8329 0,8896 0,5853
Inglés 0,6819 0,7505 0,7597 0,6031 0,7965
Italiano 0,5145 0,8794 0,8646 0,6794 0,7812 0,7758
Portugués 0,4706 0,9454 0,8655 0,6274 0,7371 0,7167 0,8285
Tabla 15: Tabla de doble entrada que recoge la comparativa de la afinidad de los idiomas estudiados.

27
12. Conclusiones
12.1. Conclusiones actividad 1

Observamos como a partir de los patrones de un idioma/lengua se es capaz de descifrar textos


codificados en la misma lengua. Tal vez con la resolución de 5 textos no se puede identificar
del todo el patrón general de la lengua, pero si obtener una idea de ella. En conclusión,
podemos observar un ejemplo directo de uso de la estadística.

Tiempo de dedicación (Excel + Informe): 2 horas

12.2. Conclusiones actividad 2

En verde tenemos el castellano-catalán y el castellano-portugués. Esto quiere decir que tienen


una ortografía común bastante grandes entre si. Se debe a que son lenguas derivadas del
romano. El castellano-portugués están ubicados en la misma península lo que haya una
interconexión directa y así mismo pasa con el catalán.

Apreciamos que el alemán junto el euskera son las lenguas con menos semejanzas ortográficas
tienen con el resto de las lenguas siendo todo rojo, menos el caso de alemán-francés que se
encuentra en amarillo. Esto puede ser debido a la cercanía entre los dos países.

Vemos que la relación alemán-euskera es el valor mas pequeño de similitud entre dos de las
lenguas estudiadas.

La gran mayoría de casos en amarillo, excepto la inglesa, son debidos a que provienen de
lenguas romances, es decir, tienen un pasado común. Por lo que sucede con la lengua inglesa
el color amarillo puede ser debido a los anglicismos actuales.

Tiempo de dedicación (Excel + Informe): 6 horas

28

Potrebbero piacerti anche