Sei sulla pagina 1di 14

Universidad Rural de Guatemala

Licenciatura en Ciencias Jurídicas y Sociales


Siquinala 035
Fredy Amílcar Garcia Aceytuno
170190036
Cuarto Semestre 2018

Segunda entrega de Texto Paralelo de la asignatura de Estadistica.

Siquinalá, 30 de Septiembre de 2018


VARIANZA.

Varianza (S2 o 2): Es el resultado de la división de la sumatoria de las distancias


existentes entre cada dato y su media aritmética elevadas al cuadrado, y el número total
de datos.

Distinguimos dos símbolos para identificar la varianza: S2 para datos muestrales, y σ2


para datos poblacionales. Note que la fórmula para la varianza muestral presenta en su
denominador al tamaño de la muestra menos uno, tendencia adoptada por los
estadísticos para denotar una varianza más conservadora.

Así la varianza es la media de los cuadrados de las diferencias entre cada valor de la
variable y la media aritmética de la distribución.

Aunque esta fórmula es correcta, en la práctica interesa realizar inferencias


poblacionales, por lo que en el denominador en vez de n, se usa n-1.

También hay otra función más sencilla de realizar y con menos riesgo de tener
equivocaciones :

La varianza representa la media aritmética de las desviaciones con respecto a la media


elevadas al cuadrado. Si atendemos a la colección completa de datos obtenemos la
varianza poblacional; y si por el contrario prestamos atención sólo a una muestra de la
población, obtenemos en su lugar la varianza muestral.

Expresión de la varianza muestral:

Expresión la varianza poblacional:


Expresión de la desviación estándar poblacional:

DESVIACIÓN ESTÁNDAR

Es una medida de dispersión para variables de razón (ratio o cociente) y de intervalo, de


gran utilidad en la estadística descriptiva. Es una medida (cuadrática) que informa de la
media de distancias que tienen los datos respecto de su media aritmética, expresada en
las mismas unidades que la variable.

Para abordar las cuestiones que comentábamos en el párrafo anterior, nos valemos de
herramientas como la varianza y la desviación estándar. Ambas medidas están
estrechamente relacionadas ya que definimos una a partir de la otra.

Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, sino que necesitamos conocer también la desviación que representan
los datos en su distribución respecto de la media aritmética de dicha distribución, con
objeto de tener una visión de los mismos más acorde con la realidad a la hora de
describirlos e interpretarlos para la toma de decisiones.

La desviación estándar o desviación tipo se define como la raíz cuadrada de los


cuadrados de las desviaciones de los valores de la variable respecto a su media.
Desviación media

La desviación media es la media aritmética de los valores absolutos de las desviaciones


respecto a la media.

Un análisis estadístico en el que se utiliza toda la información disponible permite


obtener mejores conclusiones. Para describir la dispensación de los datos, se prefiere
utilizar una medida de tendencia central como referencial porque se calcula con todos
los valores de las mediciones y su propósito es central. Esto es lo que sucede con la
desviación media, una medida de la dispersión de las mediciones alrededor de la media
aritmética.

La desviación media, DM, de un conjunto de valores numéricos de una muestra se


define como

Dado que se utilizan valores absolutos, la desviación media siempre es positiva. Como
se menciono antes, la desviación media es un estadístico si se calcula con datos de una
muestra, y es un parámetro se calcula con todos los datos de una población.

MEDIA ARITMETICA.

En matemáticas y estadística, la media aritmética (también llamada promedio o


simplemente media) de un conjunto finito de números es el valor característico de una
serie de datos cuantitativos objeto de estudio que parte del principio de la esperanza
matemática o valor esperado, se obtiene a partir de la suma de todos sus valores dividida
entre el número de sumandos. Cuando el conjunto es una muestra aleatoria recibe el
nombre de media muestral siendo uno de los principales estadísticos muestrales.
Expresada de forma más intuitiva, podemos decir que la media (aritmética) es la
cantidad total de la variable distribuida a partes iguales entre cada observación.

Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en
sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes
iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la
información de una distribución (dinero en el bolsillo) suponiendo que cada observación
(persona) tuviera la misma cantidad de la variable.

Fórmula para calcular la media aritmética:

𝑋1 + 𝑋2 + 𝑋3 + 𝑋4 + 𝑋𝑛
𝑋̅ =
𝑛

MEDIA PONDERADA

Es una Medida de Tendencia Central o Medida de Posición Central, que se determina en


un conjunto de números al resultado de multiplicar cada uno de los números por un
valor particular para cada uno de ellos, llamado su peso, y obteniendo a continuación la
media aritmética del conjunto formado por los productos anteriores. Se utiliza la media
ponderada cuando no todos los elementos componentes de los que se pretende obtener
la media tienen la misma importancia.

Para una serie de datos

a la que corresponden los pesos

la media ponderada se calcula como:

Un ejemplo es la obtención de la media ponderada de las notas de en la que se asigna


distinta importancia (peso) a cada una de las pruebas de que consta el examen, entonces
se multiplicaría cada nota por su correspondiente peso y el resultado obtenido se divide
entre la suma de los pesos asignados.

Datos

Peso

Media Ponderada

MEDIA GEOMÉTRICA

En matemáticas y estadística, la media geométrica de una cantidad arbitraria de


números (por decir n números) es la raíz n-ésima del producto de todos los números, es
recomendada para datos de progresión geométrica, para promediar razones, interés
compuesto y números índices.

Por ejemplo, la media geométrica de 2 y 18 es

Otro ejemplo, la media de 1, 3 y 9 sería

Propiedades

 El logaritmo de la media geométrica es igual a la media aritmética de los


logaritmos de los valores de la variable.
 La media geométrica de un conjunto de números positivos es siempre menor o
igual que la media artimética:

La igualdad sólo se alcanza si .

Ventajas

 considera todos los valores de la distribución y

 es menos sensible que la media aritmética a los valores extremos.

Desventajas

 es de significado estadístico menos intuitivo que la media aritmética,

 su cálculo es más difícil y

 en ocasiones no queda determinada; por ejemplo, si un valor entonces la


media geométrica se anula.

Solo es relevante la media geométrica si todos los números son positivos. Como hemos
visto, si uno de ellos es 0, entonces el resultado es 0. Si hubiera un número negativo (o
una cantidad impar de ellos) entonces la media geométrica sería o bien negativa, o bien
inexistente en los números reales.

En muchas ocasiones se utiliza su trasformación en el manejo estadístico de variables


con distribución no normal.

La media geométrica es relevante cuando varias cantidades son multiplicadas para


producir un total.
MEDIANA

Con esta medida podemos identificar el valor que se encuentra en el centro de los datos,
es decir, nos permite conocer el valor que se encuentra exactamente en la mitad del
conjunto de datos después que las observaciones se han ubicado en serie ordenada. Esta
medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la
otra mitad por encima del mismo. Para determinar la posición de la mediana se utiliza la
fórmula

Ecuación 5-5

Para comprender este concepto vamos a suponer que tenemos la serie ordenada de
valores (2, 5, 8, 10 y 13), la posición de la mediana sería:

Lo que nos indica que el valor de la mediana corresponde a la tercera posición de la


serie, que equivale al número (8). Si por el contrario contamos con un conjunto de datos
que contiene un número par de observaciones, es necesario promediar los dos valores
medios de la serie. Si en el ejemplo anterior le anexamos el valor 15, tendríamos la serie
ordenada (2, 5, 8, 10, 13 y 15) y la posición de la mediana sería,

Es decir, la posición tres y medio. Dado que es imposible destacar la posición tres y
medio, es necesario promediar los dos valores de la posiciones tercera y cuartapara
producir una mediana equivalente, que para el caso corresponden a (8 + 10)/2 =9. Lo
que nos indicaría que la mitad de los valores se encuentra por debajo del valor 9 y la
otra mitad se encuentra por encima de este valor.

En conclusión la mediana nos indica el valor que separa los datos en dos fracciones
iguales con el cincuenta porciento de los datos cada una. Para las muestras que cuentan
con un número impar de observaciones o datos, la medianadará como resultado una de
las posiciones de la serie ordenada; mientras que para las muestras con un número par
de observaciones se debe promediar los valores de las dos posiciones centrales.

MODA

La medida modal nos indica el valor que más veces se repite dentro de los datos; es
decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que más veces se repite es el
número 2 quien seria la moda de los datos. Es posible que en algunas ocasiones
se presente dos valores con la mayor frecuencia, lo cual se denominaBimodal o en otros
casos más de dos valores, lo que se conoce como multimodal.

En conclusión las Medidas de tendencia central, nos permiten identificar los valores
más representativos de los datos, de acuerdo a la manera como se tienden a concentrar.
La Media nos indica el promedio de los datos; es decir, nos informa el valor que
obtendría cada uno de los individuos si se distribuyeran los valores en partes iguales.
La Mediana por el contrario nos informa el valor que separa los datos en dos partes
iguales, cada una de las cuales cuenta con el cincuenta porciento de los datos. Por
último la Moda nos indica el valor que más se repite dentro de los datos.
TEOREMA DE BAYES

La regla de Bayes es solo una técnica para calcular probabilidades condicionales, y


como regla de probabilidad es indiscutible así como su validez. A partir de un conjunto
de probabilidades llamadas "a priori" o "sin corregir", calcula un conjunto de
probabilidades "a posteriori" o "corregidas" que no son más que una modificación de las
primeras ante la evidencia de que un determinado suceso ha ocurrido.

Para aclarar estos conceptos, observemos a continuación la diferencia entre el planteo


de probabilidad condicional realizado hasta este momento y el de Bayes. Cuando
nosotros escribimos:

P(B|A) decimos que esto es la probabilidad de que habiendo ocurrido el suceso A,


ocurra B. Probabilidad condicional.

El planteo que hace la Regla de Bayes es: el suceso B ha ocurrido, cual es la


probabilidad de que provenga de A. Que A sea causa de B. O sea debo hallar P(A|B).

De una manera más general podemos decir: El evento B ha ocurrido, cual es la


probabilidad de que haya sido generado por el suceso A1, el A2, etc.; causas posibles y
excluyentes entre sí.

Sabemos que:

P(Ai ∩ B)
P(B|Ai ) =
P(Ai )

P(Ai ∩ B)
P(Ai |B) =
P(B)

De lo que se deduce:

P(Ai |B) × P(B) = P(B|Ai ) × P(Ai )

P(B|Ai ) × P(Ai )
P(Ai |B) = … (α)
P(B)

Para calcular P(B), supongamos que hay N eventos (A1,A2,A3,..An) mutuamente


excluyentes entre sí que podrían causar el evento B(efecto). El efecto B debería ser
generado por una de esas causas; entonces la probabilidad de que B ocurra puede estar
dada por:

P(B) = P(B ∩ Ω)

P(B) = P[B ∩ (A1 ∪ A2 ∪ A3 ∪. … ∪ An )]

P(B) = P[(A1 ∩ B) ∪ (A2 ∩ B) ∪ (A3 ∩ B) ∪. … ∪ (An ∩ B)]

Como los sucesos Ai son mutuamente excluyentes, entonces: (Ai ∩ B) y (Aj ∩ B) deben
serlo para todo i distinto de j. Por la regla de adición obtenemos:

P(B) = P(A1 ) × P(B|A1 ) + P(A2 ) × P(B|A2 ) +. … + P(An ) × P(B|An )

Reemplazando este resultado en la ecuación (α) obtenemos:

Regla de bayes

P(Ai )P(B|Ai )
P(Ai |B) =
P(A1 )P(B|A1 )+. … + P(An )P(B|An )

Para: i=1...n

Repasemos el significado de estos términos:

P(Ai|B) : Probabilidad del evento Ai dado que B ocurre.

P(Ai) : Probabilidad de ocurrencia del evento Ai ; probabilidad “a priori” o sin


corregir.

P(B|Ai) : Probabilidad del evento B dado que Ai ocurre.

P(AiB): Probabilidad de Ai y B.

Sucesos B1 B2 B3 ... Bm
A1 P(A1 ∩ B1 ) P(A1 ∩ B2 ) P(A1 ∩ B3 ) ... P(A1 ∩ Bm ) P(A1 )
A2 P(A2 ∩ B1 ) P(A2 ∩ B2 ) P(A2 ∩ B3 ) ... P(A2 ∩ Bm ) P(A2 )
A3 P(A3 ∩ B1 ) P(A3 ∩ B2 ) P(A3 ∩ B3 ) ... P(A3 ∩ Bm ) P(A3 )
...

...

...

...

...

An P(An ∩ B1 ) P(An ∩ B2 ) P(An ∩ Bn ) ... P(An ∩ Bm ) P(An )


P(B1 ) P(B2 ) P(B3 ) P(Bm )
Analisis del procedimiento

Método del Diagrama:

En algunas oportunidades con el objeto de sintetizar la información, antes de encarar la


resolución de un problema de Bayes, puede convenir la realización de una gráfica o
diagrama como se verá a continuación.

Método del Árbol: P(B|A1 )

P(B´|A1 )

P(A1 ) P(B|A2 )

P(A2 ) P(B´|A2 )
Ω
...

P(B|An )
P(A n )
P(B´|An )

Método Tabular:

Probabilidades Probabilidades Probabilidades Probabilidades


Sucesos
Previas Condicionales Conjuntas Posteriores
P(A1 ) P(B|A1 ) × P(A1 )
A1 P(A1 ) P(B|A1 )
× P(B|A1 ) P(B)

P(A2 ) P(B|A2 ) × P(A2 )


A2 P(A2 ) P(B|A2 )
× P(B|A2 ) P(B)

P(A3 ) P(B|A3 ) × P(A3 )


A3 P(A3 ) P(B|A3 )
× P(B|A3 ) P(B)
...

...

...

...

...

P(An ) P(B|An ) × P(An )


An P(An ) P(B|An )
× P(B|An ) P(B)

Sumatoria 1 P(B) 1
Ejemplo1: En una urna hay 5 bolas, 3 azules y 2 verdes. Se saca una bola de la urna y
sin mirarla, se guarda. A continuación se vuelve a sacar otra bola que es verde. ¿Cuál es
la probabilidad de que la primera haya sido verde?. Y si la segunda hubiera sido azul,
¿cuál es la probabilidad de que la primera sea verde?. ¿Y azul?.

Un diagrama nos aclara la situación

En donde (A1 y A2), es el suceso "sacar azul la primera bola y azul la segunda" y
análogamente los restantes (A1 y V2), (V1 y A2), (V1 y V2).

Probabilidad de que la primera haya sido verde (en el supuesto que la segunda ha sido
verde)
Aplicamos el teorema de Bayes y resulta:

Probabilidad de que la primera haya sido verde (en el supuesto que la segunda ha sido
azul)
Aplicamos el teorema de Bayes y resulta:
Probabilidad de que la primera haya sido azul (en el supuesto que la segunda ha sido
azul)
Aplicamos el teorema de Bayes y resulta:

Potrebbero piacerti anche