Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Así la varianza es la media de los cuadrados de las diferencias entre cada valor de la
variable y la media aritmética de la distribución.
También hay otra función más sencilla de realizar y con menos riesgo de tener
equivocaciones :
DESVIACIÓN ESTÁNDAR
Para abordar las cuestiones que comentábamos en el párrafo anterior, nos valemos de
herramientas como la varianza y la desviación estándar. Ambas medidas están
estrechamente relacionadas ya que definimos una a partir de la otra.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, sino que necesitamos conocer también la desviación que representan
los datos en su distribución respecto de la media aritmética de dicha distribución, con
objeto de tener una visión de los mismos más acorde con la realidad a la hora de
describirlos e interpretarlos para la toma de decisiones.
Dado que se utilizan valores absolutos, la desviación media siempre es positiva. Como
se menciono antes, la desviación media es un estadístico si se calcula con datos de una
muestra, y es un parámetro se calcula con todos los datos de una población.
MEDIA ARITMETICA.
Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en
sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes
iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la
información de una distribución (dinero en el bolsillo) suponiendo que cada observación
(persona) tuviera la misma cantidad de la variable.
𝑋1 + 𝑋2 + 𝑋3 + 𝑋4 + 𝑋𝑛
𝑋̅ =
𝑛
MEDIA PONDERADA
Datos
Peso
Media Ponderada
MEDIA GEOMÉTRICA
Propiedades
Ventajas
Desventajas
Solo es relevante la media geométrica si todos los números son positivos. Como hemos
visto, si uno de ellos es 0, entonces el resultado es 0. Si hubiera un número negativo (o
una cantidad impar de ellos) entonces la media geométrica sería o bien negativa, o bien
inexistente en los números reales.
Con esta medida podemos identificar el valor que se encuentra en el centro de los datos,
es decir, nos permite conocer el valor que se encuentra exactamente en la mitad del
conjunto de datos después que las observaciones se han ubicado en serie ordenada. Esta
medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la
otra mitad por encima del mismo. Para determinar la posición de la mediana se utiliza la
fórmula
Ecuación 5-5
Para comprender este concepto vamos a suponer que tenemos la serie ordenada de
valores (2, 5, 8, 10 y 13), la posición de la mediana sería:
Es decir, la posición tres y medio. Dado que es imposible destacar la posición tres y
medio, es necesario promediar los dos valores de la posiciones tercera y cuartapara
producir una mediana equivalente, que para el caso corresponden a (8 + 10)/2 =9. Lo
que nos indicaría que la mitad de los valores se encuentra por debajo del valor 9 y la
otra mitad se encuentra por encima de este valor.
En conclusión la mediana nos indica el valor que separa los datos en dos fracciones
iguales con el cincuenta porciento de los datos cada una. Para las muestras que cuentan
con un número impar de observaciones o datos, la medianadará como resultado una de
las posiciones de la serie ordenada; mientras que para las muestras con un número par
de observaciones se debe promediar los valores de las dos posiciones centrales.
MODA
La medida modal nos indica el valor que más veces se repite dentro de los datos; es
decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que más veces se repite es el
número 2 quien seria la moda de los datos. Es posible que en algunas ocasiones
se presente dos valores con la mayor frecuencia, lo cual se denominaBimodal o en otros
casos más de dos valores, lo que se conoce como multimodal.
En conclusión las Medidas de tendencia central, nos permiten identificar los valores
más representativos de los datos, de acuerdo a la manera como se tienden a concentrar.
La Media nos indica el promedio de los datos; es decir, nos informa el valor que
obtendría cada uno de los individuos si se distribuyeran los valores en partes iguales.
La Mediana por el contrario nos informa el valor que separa los datos en dos partes
iguales, cada una de las cuales cuenta con el cincuenta porciento de los datos. Por
último la Moda nos indica el valor que más se repite dentro de los datos.
TEOREMA DE BAYES
Sabemos que:
P(Ai ∩ B)
P(B|Ai ) =
P(Ai )
P(Ai ∩ B)
P(Ai |B) =
P(B)
De lo que se deduce:
P(B|Ai ) × P(Ai )
P(Ai |B) = … (α)
P(B)
P(B) = P(B ∩ Ω)
Como los sucesos Ai son mutuamente excluyentes, entonces: (Ai ∩ B) y (Aj ∩ B) deben
serlo para todo i distinto de j. Por la regla de adición obtenemos:
Regla de bayes
P(Ai )P(B|Ai )
P(Ai |B) =
P(A1 )P(B|A1 )+. … + P(An )P(B|An )
Para: i=1...n
P(AiB): Probabilidad de Ai y B.
Sucesos B1 B2 B3 ... Bm
A1 P(A1 ∩ B1 ) P(A1 ∩ B2 ) P(A1 ∩ B3 ) ... P(A1 ∩ Bm ) P(A1 )
A2 P(A2 ∩ B1 ) P(A2 ∩ B2 ) P(A2 ∩ B3 ) ... P(A2 ∩ Bm ) P(A2 )
A3 P(A3 ∩ B1 ) P(A3 ∩ B2 ) P(A3 ∩ B3 ) ... P(A3 ∩ Bm ) P(A3 )
...
...
...
...
...
P(B´|A1 )
P(A1 ) P(B|A2 )
P(A2 ) P(B´|A2 )
Ω
...
P(B|An )
P(A n )
P(B´|An )
Método Tabular:
...
...
...
...
Sumatoria 1 P(B) 1
Ejemplo1: En una urna hay 5 bolas, 3 azules y 2 verdes. Se saca una bola de la urna y
sin mirarla, se guarda. A continuación se vuelve a sacar otra bola que es verde. ¿Cuál es
la probabilidad de que la primera haya sido verde?. Y si la segunda hubiera sido azul,
¿cuál es la probabilidad de que la primera sea verde?. ¿Y azul?.
En donde (A1 y A2), es el suceso "sacar azul la primera bola y azul la segunda" y
análogamente los restantes (A1 y V2), (V1 y A2), (V1 y V2).
Probabilidad de que la primera haya sido verde (en el supuesto que la segunda ha sido
verde)
Aplicamos el teorema de Bayes y resulta:
Probabilidad de que la primera haya sido verde (en el supuesto que la segunda ha sido
azul)
Aplicamos el teorema de Bayes y resulta:
Probabilidad de que la primera haya sido azul (en el supuesto que la segunda ha sido
azul)
Aplicamos el teorema de Bayes y resulta: