Sei sulla pagina 1di 8

INSTITUTO TECNOLGICO DE SANTO DOMINGO

Probabilidad y Estadstica

Nombres: Luisanny
Apellidos: Marez Mojica
ID: 1063170
Prof. Boanerges Domnguez

Resumen del captulo 1


Probabilidad y Estadstica para Ingenieros

Resumen Captulo I. Introduccin a la Estadstica y el anlisis de datos.


1.1 Panorama general: inferencia estadstica, muestras, poblaciones y papel de la probabilidad
Existe una gran diferencia entre lo que es el acopio de informacin y la estadstica inferencial. La
estadstica inferencial nace de la necesidad de estar preparados para enfrentar la incertidumbre y la
variacin en los datos de una manera eficaz, con el fin de realizar cambios en un determinado proceso
para mejorar su calidad.
En cuanto a la variacin de los datos se debe tomar en cuenta lo que son las fuentes de variabilidad de los
datos.
Variabilidad en los datos cientficos
Cuando se decide estudiar algn fenmeno, el objeto de estudio en general se denomina como poblacin.
Si se toma una parte de la poblacin a esta se le llama muestra. Existen diferentes tipos de muestra segn
como sea concebida. Por ejemplo: la muestra aleatoria, que como dice su nombre, se genera al partir de
una eleccin aleatoria entre los datos, donde cada uno tiene la misma probabilidad de ser tomado.
La estadstica descriptva nos permite tener a mano diferentes datos y caractersticas de la poblacin sin
necesidad de predecir o inferir algo en torno a estos. Entre estas cantidades reconocidas estn: la Media,
Mediana, Moda, etc.

Cmo trabajan juntas la probabilidad y la inferencia estadstica?


Se afirma que la inferencia estadstica emplea los conceptos de probabilidad. La informacin muestral
est disponible para el analista, y con la ayuda de los mtodos estadsticos y elementos de probabilidad,
podemos obtener conclusiones acerca de alguna caracterstica de la poblacin.

Medidas en una muestra


a) Frecuencia absoluta : indica el nmero de veces que se repite una variable.
b) Tamao de la muestra : indica la cantidad de elementos que conforman la muestra, se
obtiene sumando todas las frecuencias absolutas.

c) Frecuencia relativa : es la proporcin de datos que se encuentra en una clase, se obtiene


dividiendo la frecuencia absoluta de la clase por el tamao de la muestra.
d) Frecuencia absoluta acumulada : indica la cantidad de datos que se encuentran hasta
cierta clase.
e) Frecuencia relativa acumulada : es la proporcin de datos acumulados que se
encuentran hasta cierta clase.

Medidas de tendencia central y de dispersin


En todo anlisis y/o interpretacin se pueden utilizar diversas medidas descriptivas que
representan las propiedades de tendencia central, dispersin y forma para extraer y resumir las principales
caractersticas de los datos. Si se calculan a partir de una muestra de datos, se les denomina estadsticos; si se les
calcula a partir de una poblacin se les denomina parmetros.

Medidas de tendencia central


La mayor parte de los conjuntos de datos muestran una tendencia a agruparse alrededor de un
punto "central" y por lo general es posible elegir algn valor que describa todo un conjunto de datos.
Un valor tpico descriptivo como ese es una medida de tendencia central o "posicin". Las medidas de
tendencia central a estudiar son: media aritmtica, mediana y moda.

Media aritmtica
La media aritmtica ( tambin denominada media ) es la medida de tendencia central que se
utiliza con mayor frecuencia. Se calcula sumando todas las observaciones de un conjunto de datos,
dividiendo despus ese total entre el nmero total de elementos involucrados.
La media aritmtica de un conjunto de valores se define como el cociente entre la
suma de los valores y el nmero de ellos. Su smbolo es si la media aritmtica es de una muestra y

Mediana
La mediana es el valor que se encuentra en el centro de una secuencia ordenada de datos. La
mediana no se ve afectada por observaciones extremas en un conjunto de datos. Por ello, cuando se
presenta alguna informacin extrema, resulta apropiado utilizar la mediana, y no la media, para describir el conjunto
de datos.
a) Mediana para datos no agrupados
Se deben ordenar los datos de forma creciente o decreciente. Para muestras con un nmero par de
observaciones, la mediana es el dato que queda en el centro de dicha ordenacin y para muestras con nmero impar
de observaciones la mediana es el promedio de los dos datos centrales.

Moda
La moda es el valor de un conjunto de datos que aparece con mayor frecuencia. Se le obtiene
fcilmente a partir de un arreglo ordenado. A diferencia de la media aritmtica, la moda no se afecta ante la
ocurrencia de valores extremos. Sin embargo, slo se utiliza la moda para propsitos descriptivos porque es ms
variable, para distintas muestras, que las dems medidas de tendencia central. Un conjunto de datos puede tener ms
de una moda o ninguna.

Medidas de dispersin
Una segunda propiedad que describe a un conjunto de datos es la dispersin. Dispersin es el
grado de variacin o diseminacin de los datos. Dos conjuntos de datos pueden diferir tanto en tendencia central
como en dispersin o dos conjuntos de datos pueden tener las mismas medidas de tendencia central, pero diferir
mucho en trminos de dispersin.
Los estadgrafos de dispersin nos indican si la distribucin o conjunto de datos forma grupos
homogneos o heterogneos. Las medidas de dispersin a estudiar son: rango, desviacin media, varianza y
desviacin estndar.

Rango
Indica el nmero de valores que toma la variable. El rango es la diferencia entre el valor mximo
y el valor mnimo de un conjunto de datos.

Medidas de variabilidad
Varianza y Desviacin Estndar
Dos medidas de dispersin que se utilizan con frecuencia y que s toman en consideracin la
forma en que se distribuyen los valores son la varianza y su raz cuadrada, la desviacin estndar.
Estas medidas establecen la forma en que los valores fluctan con respecto a la media.

Varianza
La varianza se define como el promedio aritmtico de las diferencias entre cada uno de los valores
del conjunto de datos y la media aritmtica del conjunto elevadas al cuadrado.

Qu indican la Varianza y la Desviacin Estndar?


La varianza y la desviacin estndar miden la dispersin "promedio" en torno a la media
aritmtica, es decir, cmo fluctan las observaciones mayores por encima de la media aritmtica y cmo se
distribuyen las observaciones menores por debajo de ella.
La varianza tiene ciertas propiedades matemticas tiles. Sin embargo, al calcularla se obtienen
unidades al cuadrado cm2, pulgadas2, mm2, (edades)2, (horas)2, etc. por ello, en la prctica, la principal medida de
dispersin que se utiliza es la desviacin estndar, cuyo valor est dado en las unidades originales cm, pulgadas,
mm, edades, horas, etc.

Enfoques de probabilidad
1) Experimento aleatorio o experimento: cualquiera operacin cuyo resultado no puede ser
predicho de anterioridad con seguridad.
Ejemplo:
a) lanzamiento de una moneda
b) lanzamiento de un dado
c) extraccin de una carta de una baraja de 52 cartas
2) Espacio muestral: es el conjunto de todos los posibles resultados asociados a un experimento.
Su smbolo es . Si el espacio muestral tiene un nmero finito de elementos o infinito numerable,
entonces se dice que ste es discreto y si el espacio muestral tiene como elementos todos los puntos de algn
intervalo real, entonces se dice que ste es continuo .
Ejemplo:
a) Experimento: lanzamiento de un dado
b) Experimento: tiempo de duracin de un tubo fluorescente.
3) Evento o suceso: es cualquier subconjunto de un espacio muestral. Todo subconjunto es un
evento, en particular mismo es un evento, llamado suceso seguro y el conjunto vaco, , tambin es un evento,
llamado suceso imposible .

La varibilidad
La variabilidad de una muestra desempea un papel importante en el anlisis de datos. La variabilidad de procesos y
productos es un hecho real en los sistemas cientficos y de ingeniera: el control o la reduccin de la variabilidad de
un proceso a menudo es una fuente de mayores dificultades. Cada vez ms ingenieros y administradores de procesos
estn aprendiendo que la calidad del producto y, como resultado, las utilidades que se derivan de los productos
manufacturados es, con mucho, una funcin de la variabilidaddel proceso.
Histograma de Frecuencias

Los histogramas son diagramas de barras verticales en los que se construyen barras rectangulares en los lmites de
cada clase. La variable aleatoria o fenmeno de inters se despliega a lo largo del eje horizontal; el eje vertical
representa el nmero, proporcin o porcentaje de observaciones por intervalo de clase, dependiendo de si el
histograma particular, es un histograma de frecuencia, un histograma de frecuencia relativa o histograma de
porcentaje.

Diagrama de rbol Diagrama Sistemtico


El Diagrama de rbol, o diagrama sistemtico, es una herramienta de la calidad que permite obtener una visin de
conjunto de los medios necesarios para alcanzar una meta o resolver un problema.
Partiendo de una informacin general, como la meta a alcanzar, se incrementa gradualmente el grado de detalle
sobre los medios necesarios para su consecucin. Este mayor detalle se representa mediante una estructura en la que
se comienza con una meta general (el tronco) y se contina con la identificacin de niveles de accin ms precisos
(las sucesivas ramas). Las ramas del primer nivel constituyen medios para alcanzar la meta pero, a su vez, estos
medios tambin son metas, objetivos intermedios, que se alcanzarn gracias a los medios de las ramas del nivel
siguiente. As repetidamente hasta llegar a un grado de concrecin suficiente sobre los medios a emplear.
La utilizacin del Diagrama de rbol permite descomponer cualquier meta general, de modo grfico, en fases u
objetivos concretos, as como determinar acciones detalladas para alcanzar un objetivo.

Potrebbero piacerti anche