Sei sulla pagina 1di 32

CAPTULO 1.

Conceptos generales de probabilidad

1.1 QU ES ESTADSTICA? El campo de la estadstica tiene que ver con la recopilacin, presentacin, anlisis y uso de datos para tomar decisiones y resolver problemas. La estadstica surge como herramienta en la ingeniera, la ciencia y la administracin, porque casi todos los procesos y sistemas de la vida real existen variabilidad; la variabilidad es el resultado de cambios en las condiciones bajo las que se hacen las observaciones. 1.2 DIVISIN DE LA ESTADSTICA La estadstica para su estudio se divide en dos grandes (2) rama:

1.2.1 Estadstica Descriptiva


Tiene como finalidad colocar en evidencia aspectos caractersticos (promedio, probabilidad de datos, etc.) que sirvan para efectuar comparaciones sin pretender sacar condiciones de tipo general. Esta designacin se realiz a travs de la elaboracin de cuadros, grficos, clculos de promedios, varianzas) Mediante el anlisis de regiones.

1.2.2 Estadstica Inferencial


Busca dar explicaciones al conjunto de observaciones, prueban la significacin o validez de los resultados; intenta descubrir las causas que originan este comportamiento. La estadstica inferencial proporciona mtodos para estimar caractersticas de un grupo total (poblacin o universo), basndose en datos de un conjunto pequeo (muestra) de observaciones. 1.3 CONCEPTOS BSICOS DE LA ESTADSTICA Daremos a conocer solamente el vocabulario estadstico bsico, los dems trminos se definirn ha mediado que se vaya presentando la necesidad.

1.3.1 Entidad
Cada uno de los elementos de un grupo o conjunto que se va a someter a estudio estadstico

PROBABILIDAD Y ESTADISTICA

CAPTULO 1. Conceptos generales de probabilidad

1.3.2 Variable
Es el conjunto de las caractersticas de las entidades que interesan en una investigacin estadstica. Los valores que pueden tomar una variable en estadstica no se pueden medir antes de realizar el experimento estadstico; por lo tanto el valor es aleatorio(al azar). Las caractersticas que se pueden medir en una entidad son de tipo cuantitativo (categrico); como cada caracterstica es una variable aleatoria, estas tienen las siguientes subdivisiones:

Variable Cuantitativa

Continua

VARIABLE ALEATORIA

Variable Cualitativa o Categorica

Discreta

1.3.2.1 Variable cuantitativa


Se dice que una variable es cuantitativa siempre que los valores queson el resultado de medidas numericas.Ejemplo de variable cuantitativa son la densidad, el peso,la viscocida, la temperatura, etc.

1.3.2.1.1 Variable Cauntitativa Continua


Una variable continua es aquella que teoricamente pueden tomar cualquier valor dentro de un intervalo de valores. Es decir, una variable continua se mede unifoermemente. Por ejemplo, si la variable en gramos la definimos como X, esta puede estar en el intervalo

1.3.2.1.2 Cuantitativa Discreta Variable


Cuando los valores numericos que pueden tomar una variable son numeros enteros, la variable se denomina discreta. Por ejemplo, si la variable es la

PROBABILIDAD Y ESTADISTICA

CAPTULO 1. Conceptos generales de probabilidad

edad cumplida en aos de una persona, esta solo puede tomar los valores de 1,2,3,, 120 (si la expectativa de voda es 120 aos)

1.3.2.2

Variable cualitativa

hay muchas cosas en que no es posible hacer medidas numericas. Por ejemplo, la variable color puede recibir los valores cualitativas de rojo, verde, amarillo, etc. Una variable cuyos valores consiste en categorias de clacificacion se denomina variable cualitativa.

1.3.3 Poblacion o Universo


Conjunto de valores de alguna variable aleatoria relacionado con un conjunto de entidades. Por ejemplo podemos hablar de una poblacion de pesos, uan poblacion o un universo de dencidades. Podemos entonces definir poblacin como el conjunto mas grande de valores (de una variable), por el cual existe algun interes. Esta definicion indica que las poblacion son definidas por el investigador y no estan predeterminadas. Al definir nuestra esfera de interes definimos nuestra poblacion. Las poblaciones o universos pueden ser finitos o infinitos. En el campo de la ingenieria y las ciencias generalmente las poblaciones son infinitas.

1.3.4 Muestra
Una muetra es una parte de la pablacion o universo . ) , puede El tamao completo de una poblacion aun siendo finita ( desanimarnos a intentar investigarla en su totalidad. Puede ser conveniente o necesario examinar solo una fraccion (muestra) de la poblacion. 1.4 ETAPAS EN UNA INVESTIGACION ESTADISTICA Para la realizacion de un estudio estadistico se deben seguir ciertas etapas entre las cuales las mas importantes son: I. Plantamiento o formulacion del problema II. Formulacion de objetos III. Definicion de la entidad a estudiar o investigar IV. Formulacion de hipotesisi V. Metodo de investigacion (total o parcial) VI. Recoleccion de datos

PROBABILIDAD Y ESTADISTICA

CAPTULO 1. Conceptos generales de probabilidad

VII. VIII.

Generalizacion o inferencia final Presentacion del informe y publicacion

Al definir la entidad en la etapa III se debe tener en cuenta: Seleccionar las variables a medir (cuantitativos y cualitativas) y definirlas correctamente. Si la variable es cuantitativa continua establecer el tipo de aproximacion (redondeos). En la etapa Vsi la investigacion es parcial establecer el tamao de la mustra. Esquematizacion le etapa III con sus variables VARIABLES X = peso en gramos Y = densidad ( Z = color ENTIDAD (producto determinado) )

1.5 Redondeo
Redondear una medida numerica es aproximada siempre que se reguistren, en este texto,resultados finales o intermedios se tendran las suiguientes reglas: a. Si el digito que queda a la derecha de la posicion del ultimo digito que se va a retener (registrar) es menor que 5 se registrara el ultimo digito a retener tal como esta. b. Si el digito que queda a la derecha de la posicion del ultimo digito que se va a retener es mayor que 5 se la suma la unidad (1) al ultimo digito que se va a retener. c. Si el digito que queda a la derecha de la posicion del ultimo digito que se va a retener es igual a 5 y el digito que se vba artener es par se deja igual y si el digito a retener es impar aumantale sumadole 1. Esquematizando los numerales a, b, c digito a retener m n n <5 =5 >5 m se deja igual es par se deja igual impar se le suma la 1 se le suma la unidad

m ultimo digito a retener

PROBABILIDAD Y ESTADISTICA

CAPTULO 1. Conceptos generales de probabilidad

n digito a la derecha del digito a retener

EJEMPLO resultados finales o intermedios 175.78 7 175.78 3 175.78 5 175.77 5 resultados registrados 175.79 175.78 175.78 175.78

1.6DISTRIBUCIONES DE FRECUANCIA Una distribucion de frecuancia o tabla de frecuancia es una disposicin tabular de datos; los datos se distribuyen por clases o caregorias con sus correspondientes frecuancias. Primero se divide el rango de los datos en clases, si es posible, las clases deben tener el mismo ancho con la finalidad de mejorar la informacion visnal en la distribucion de frecuancias. Para la solucion del numero de clases debe emplearse cierto creterio de modo que pueda desarrollarse un diagrama razonable. El minimo de clases depende del numero de observacones y de la dispersion de los datos. En general, una distribucion de ferecuancias que emplea muy pocas clases o demaciadas clases no contiene mucha informacion, por lo general el minimo de clases debe fluctuar entre 5 y 10 clases. El numero de clases se puede obtener mediante cualquiera de las formulas siguinetes:

n = tamao de muetra M = numero de clases

1.6.1 Intervalo De Clase Y Limites De Clases


El simbolo que define una clase se llama intervalo de clase, los minimos extremos de este intervalo se llaman limete inferior de clase y limete superior de clase. LICi: limete inferior de la clase i LICi lSCi LSCi: limete superior de la clase i

PROBABILIDAD Y ESTADISTICA

CAPTULO 1. Conceptos generales de probabilidad

El limete inferior de la primera clase debe ser menor o igual que el dato menor (LI ) y el limete superior de la ultima debe cumplir la condicion LSCn . El limete superior de la primera calse se calculara con la siguiente formula: ( : limete superior de la primera clase : limete inferior de la primera clase : ancho de la clase : aproximacion de los datos )

La marca de clase es el punto medio de la clase, los datos que se encasillan en una clase determinada, para efectos practicos miden su marca de clase.

1.7 REGLAS GENERERALES PARA ELABORAR DISTRIBUCIONES DE FRECUANCIA Los pasos para elaborar cuadros o tablas de frecuancia son: I. II. Toma de datos Encontrar el dato mayor y el menor con el fin de dterminar el rango donde fluctuan los datos (cuando la variable es cuantitativa)

dato mayor dato menor rango III. IV. V. Establecer el minimo aproximado de categoria o clase (M) que tendra la distribucion de frecuancias Encoantrar el tamao de la clase. construir una tabla de conteo de la forma siguiente: el limite inferior de la primera clase sera menor o igual a el limite superior de la primera clase sera ( ) los limites inferiores y superiores de las clases se obtienen sumando C al limite inferior o superior de la clase anterior

VI.

PROBABILIDAD Y ESTADISTICA

CAPTULO 1. Conceptos generales de probabilidad

VII. VIII.

debe enplearse que , con el fin de que ningun dato se queda fuera de la tabulacion. Establecer los datos examinado cada uno de ellos con el fin de conocer en que categoria debe colocarse. El formato general de la tabla de conteo es: conteo frecuancia absoluta

clase

. . . Total EJEMPLO A continuacion se desarrollara una tabla de conteo para un analisis de la resistencia a la tension, en libras por pulgada cuadrada (Psi), de uan muestra de tamao 80 (n=80) de una nueva aleacion de aluminio y litio, que esta siendo evaluada como posible material para la fabricacion de elementos estructurales de aeronaves Resistencia a la tencion (Psi) de aleacion aluminio-litio 105 97 245 163 207 134 218 199 160 196 221 154 228 131 180 178 157 151 175 201 183 153 174 154 190 76 101 142 149 200 186 174 199 115 193 167 171 163 87 176 121 120 181 160 194 184 165 154 160 150 181 168 158 208 133 135 172 171 237 170 180 167 176 158 156 229 158 1448 150 118 143 141 110 133 123 146 169 158 135 149
Tabla Tabla

1-1

1-2

Sigiendo las reglas para elaborar distribuciones de frecuancia: I. II. Toma de datos Encontrar el dato mayor y el dato menor con el fin de determinar el rango; para responder a esta regla buscamos el mayor y menor por fila de la tabla 1-2 Mayor 221 174 245 Menor 105 97 110

Fila 1 2 3

PROBABILIDAD Y ESTADISTICA

CAPTULO 1. Conceptos generales de probabilidad

4 5 6 7 8 9 10

208 207 229 218 199 237 201

115 123 76 101 142 87 118

Despues se busca el mayor dato de los mayores datos por filas y este sera el mayor dato (245); igual se hace con el menor por filas (76).

Posteriormente se determina el Rango

III.

Establecer el numero aproximado de categorias o clases

IV.

Encontrar el tamao de la clase

V.

Emcontrar los limites inferiores y superiores de la primera clase o categoria.

( ( )

PROBABILIDAD Y ESTADISTICA

CAPTULO 1. Conceptos generales de probabilidad

VI.

Construir los limites inferiores y superiores de las categorias o clases subsiguientes.

Las demas clases se construyen siguiendo la formula:

VII.

La tabla de conteo quedara asi: Conteo III IIII II IIII IIII IIII IIII IIII IIII IIII IIII IIII IIII IIII IIII IIII IIII II TOTAL Frecuencia Absoluta 3 7 10 25 20 9 4 2 80

Clases 76 98 99 121 122 144 145 167 168 190 191 213 214 236 237 259

Tabla 1-3

1.7.1 Distribucin De Frecuencia Absoluta, Histograma De Frecuencia Absoluta, Polgono De Frecuencia Absoluta
A partir de la tabla de conteo 1-3 construimos la distribucin de frecuencia absoluta, teniendo de ella las clases y la columna de frecuencia absoluta. Tensin (Psi) 76 98 99 121 122 144 154 167 Nmero De Unidades (probetas) 3 7 10 25

PROBABILIDAD Y ESTADISTICA

CAPTULO 1. Conceptos generales de probabilidad

168 190 191 213 214 236 237 259 Total

20 9 4 2 80

El histograma de frecuencia absoluta y el polgono de frecuencia son dos representaciones graficas de la distribucin de frecuencia. Un histograma de frecuencias consiste en un conjunto de rectngulos con: Sus bases en el eje X horizontal, con el centro en las marcas de clase y longitudes iguales a los tamaos de clase. Las ultimas iguales a la frecuencia de clase. El polgono de frecuencia es una lnea quebrada, se obtiene conectando los puntos medios de las partes superiores de los rectngulos del histograma. Se acostumbra aadir las longitudes AM y BN a las marcas de clase extremas asociados a una frecuencia cero. La suma de las reas de los rectngulos del histograma es igual al rea total limitada por el polgono de frecuencia y el eje X. Para construir el histograma y el polgono de frecuencia de la tabla 1- 4 se procede as: a. Se encuentra la marca de clase 1.

b. Las marcas de clases siguientes se consiguen as.

( )

10

PROBABILIDAD Y ESTADISTICA

CAPTULO 1. Conceptos generales de probabilidad

HISTOGRAMA Y POLIGONO DE FRECUENCIA ABSOLUTA


35 30 25 20 15 10 5 0 64 87 110 133 156 179 202 225 248 271

Se construye una grfica X-Y; colocndola en el eje X las marcas de clases y en el eje Y las frecuencias absolutas de cada clase; para el ejemplo de muestra de tamao 80 (n=80) quedando as:
Tabla 1-4

Figura 1-1

1.7.2 Distribucin De Frecuencias Relativa


La frecuencia relativa de una clase es una frecuencia absoluta dividida por la frecuencia total de todas las clases da como resultado 1, o 100% cuando se expresa en porcentaje. Si se sustituyen las frecuencias absolutas de la tabla 1- 4 por sus correspondientes frecuencias relativas, la tabla resultante se llama una distribucin relativa o distribucin porcentual. tensin (Psi) 76 98 99 121 122 144 145 167 168 190 191 213 214 236 237 259 total frecuencia relativa (como porcentaje) 3.75 8.75 12.50 31.55 25.00 11.25 5.00 2.50 100.00

Tabla 1-5

11

PROBABILIDAD Y ESTADISTICA

CAPTULO 1. Conceptos generales de probabilidad

35 30 25 20 15 10 5 0 64

HISTOGRAMA Y POLIGONO DE FRECUENCIA RELATIVA O PORCENTUAL

La representacin grfica de la tabla 1-5, es un histograma y polgono de frecuencias relativas.

87

110 133 156 179 202 225 248 271

Figura 1-2

1.7.3 Distribucin De Frecuencias Acumulada Absoluta Y Ojiva.


La frecuencia total de todos los valores menores o iguales que el lmite superior de una clase dada se llama frecuencia acumulada; por ejemplo, la frecuencia acumulada hasta la clase 122-144 para la muestra de tamao 80 (n=80) de la aleacin litio aluminio, de la tabla 1-4 es 3+7+10=20, lo que significa que 20 probetas resistieron 144 Psi de tensin o menos. Una tabla que presenta tales frecuencias acumuladas se llama distribucin de frecuencias acumuladas absoluta o tabla de frecuencias acumuladas.

Tabla 1-6

Un grfico que recoja las frecuencias acumuladas por debajo de cualquiera de los formatos de clase superiores respecto de dicha frontera (lmite superior de clase) se llama un polgono de frecuencia acumulada u ojiva; se acostumbra a iniciar la grfica con el lmite superior de una clase que tiene frecuencia acumulada cero; si

12

PROBABILIDAD Y ESTADISTICA

tensin (Psi) menores o igual () 98 121 144 167 190 213 236 259

numero de probetas 3 10 20 45 65 74 78 80

CAPTULO 1. Conceptos generales de probabilidad

existiera la clase que 53-75; no existen probetas con resistencias menos o iguales a 75 Psi. Por lo tanto la frecuencia acumulada es cero, para 75 Psi.

90 80 70 60 50 40 30 20 10 0 75 98 121 144 167 190 213 236 259

Figura 1-3

1.7.4 Distribucin De Frecuencias Acumulada Relativas Y Ojiva.


La frecuencia acumulada relativa o frecuencia acumulada en porcentajes, es la frecuencia acumulada dividida por la frecuencia total. As por ejemplo, las tensiones (Psi) menores o iguales que 167 Psi (para el ejemplo de las probetas) representan el

Si se usan frecuencias acumuladas relativas en la tabla 1-6 y en la figura 1-3, la distribucin resultante se llama distribucin de frecuencias acumuladas relativas y polgonos de frecuencias acumuladas relativas u ojiva de porcentajes, respectivamente.
PROBABILIDAD Y ESTADISTICA

Tensin (Psi) menores o igual () 75 98 121 144 167 190 213 236 259

Porcentaje Acumulado (%) 0 3.75 12.5 25.00 56.25 81.25 92.50 97.50 100.00

Tabla 1-7

13

CAPTULO 1. Conceptos generales de probabilidad

120 100 80 60 40 20 0 75 98 121 144 167 190 213 236 259

Figura 1-4

1.8 MEDIA, MEDIANA, MODA Y OTRAS MEDIDAS DE LOCALIZACIN O LOCALIZACIN O TENDENCIA CENTRAL La presentacin tabular de los datos y graficas de estas tablas pueden mejorar la representacin de los datos, las descripciones numricas tienen gran valor en el anlisis de datos estadsticos, en esta seccin se presentan varias medidas numricas importantes para describir las caractersticas de los datos. Se llaman medidas de localizacin o tendencias central por que el centro de un conjunto de datos.

1.8.1 Media
PROBABILIDAD Y ESTADISTICA

La medida ms comn de localizacin o centro de un grupo de datos es el promedio aritmtico o media, ya que casi siempre se considera a los datos como una muestra, la media aritmtica se conoce como media muestral. Si las observaciones de una muestra de tamao n son media muestral es: EJEMPLO 2 Encontrar la media muestral de la resistencia a la tensin (en observaciones de un mortero de cemento portland. ) de 10 , entonces la

14

CAPTULO 1. Conceptos generales de probabilidad

Observaciones:
16.85, 16.40, 17.21, 16.35, 16.52, 17.04, 16.96, 17.15, 16.59, 16.57. El valor de la medida, es mas proceso que la precisin asociado con cada observacin, por esto se acostumbra calcular la media con un digito ms que los utilizados en cada medicin de la muestra. Si ordenamos las medidas de menor a mayor magnitud, y los ubicamos como puntos es un eje horizontal x calibrado, en este mismo eje determinamos el valor de la media ( ) la representacin grfica es un diagrama de puntos como sigue: Datos ordenados: 16.35 16.40 16.52 16.57 16.59 16.85 16.96 17.04 17.15 17.21 Notndose en la figura 1-4 que la media muestral=16.764, puede considerarse como un punto de equilibrio. Esto significa, que si cada observacin individual representa, por ejemplo, una libra de masa colocndolo en esos puntos del eje horizontal, un punto de apoyo localizado en equilibrara todo el sistema de pesos. De otra forma la medida es una medida que represente al subconjunto o muestra observada. Para los datos de resistencia de la aleacin de aluminio litio de la tabla 1-2, la media muestral es:
PROBABILIDAD Y ESTADISTICA

15

CAPTULO 1. Conceptos generales de probabilidad

Si se examina el histograma de la figura 1-1, se observa que la media muestral 162.7 Psi es un valor tpico de la resistencia a la tensin, ya que este se presenta en la parte media de los datos, donde se concentran las observaciones. Una desventaja de la media como medida de tensin central es que puede ser influida muy frecuentemente por un solo valor extremo y dar una idea distorsionada de los datos; para entender lo anterior, supongamos que las observaciones de muestra de tamao 7 (n=7) son las siguientes: 1, 3, 4, 2, 7, 2450, 8 Luego la medida es: En este caso, es evidente que la media muestral no dice mucho con respecto a la tendencia central de la mayor parte de los datos. Cuando se agrupan la media () se coloca la mediante la siguiente frmula:

Tambin es posible pensar en el clculo de la media para todas las observaciones de una poblacin, este promedio se conoce como media poblacional y se simboliza con la letra griega (miu). Cuando existe un mnimo finito de observaciones (N) la media es:

En muchas aplicaciones prcticas de la estadstica a problemas de la ingeniera, no se conoce la media y es imposible (o poco prctico) examinar a todos los miembros de una poblacin (n ); en los conjuntos sobre inferencia estadstica se presentan mtodos para hacer referencias sobre la medida poblacional, con base en la medida

16

PROBABILIDAD Y ESTADISTICA

CAPTULO 1. Conceptos generales de probabilidad

muestral, en ellos se emplean la media muestral () como punto de prctica para estimar .

1.8.2 Mediana
La segunda medida de tendencia central estudiada es la mediana. La mediana es la mitad de una muestra o poblacin cuyos valores estn ordenados en el orden de magnitud; es decir arreglar los valores del ms pequeo al ms grande o del ms grande al ms pequeo. Sean los valores de una muestra acumulada en orden creciente de magnitud; esto es es la segunda observacin ms pequea, es la segunda observacin,, es la observacin ms grande. Entonces, la mediana se define como el elemento que este en la posicin trminos matemticos seria: si n es impar, o el promedio si n es par. En entre las observaciones ubicadas en las posiciones y


PROBABILIDAD Y ESTADISTICA

Una ventaja de la mediana es que los valores extremos no tienen mucha de influencia sobre ella. EJEMPLO 3 Supongamos que las observaciones de una muestra son 1, 3, 4, 2, 7, 6 y 8 La media es muestral es: La media ser ( )

17

CAPTULO 1. Conceptos generales de probabilidad

La media muestral es 4.43, mientras que la mediana muestral es 4.00; ambas cantidades proporcionan una medida razonable de la tendencia central de los datos. Ahora supngase que en los datos originales se cambia el 6 por 2450, al ordenarlos quedara as 1 2 3 4 7 8 2450

La mediana sigue igual = 4.00, para estos datos la media es La media muestral =353.57 no dice mucho con respecto a la tendencia central de datos, la mediana sigue siendo =4.00, y esta es una medida de tendencia mas significativa para la mayor parte de la observaciones. EJEMPLO 3. Supngase que las calificaciones de 10 alumnos son: 0 91 92 93 94 95 95 96 97 98
PROBABILIDAD Y ESTADISTICA

n =10 (par)

La mediana es: La media es:

18

CAPTULO 1. Conceptos generales de probabilidad

Si usted fuera profesor de esta clase que medida de tendencia central prefiriera informar como el comportamiento general de la clase: la mediana 94.5 o la media 88.1?

1.8.3 La Moda
La moda es la observacin que se presenta con mayor frecuencia en la muestra; un grupo de datos puede no tener ninguna moda o tener ms de una. Esto no ocurre con la media y la mediana, medidas que para un conjunto de datos, siempre existen y son nicas. La moda no es una medida muy utilizada.

EJEMPLO 4 Encontrar para las siguientes muestras:

Muestra # 1.
3, 6, 9, 3, 5, 8, 3, 10, 4, 6, 3, 1

Muestra # 2.
3, 6, 9, 3, 5, 8, 3, 10, 4, 6, 3, 1, 6, 2, 5, 6

Solucin: Se procede a ordenar la muestra # 1 en orden de magnitud: 1, 3, 3, 3, 3, 4, 5, 6, 6, 8, 9, 10.


PROBABILIDAD Y ESTADISTICA

El dato que ms se repite es el 3, ocurre cuatro veces, por lo tanto la moda es Muestra # 2 ordenada en orden de magnitud: 1, 2, 3, 3, 3, 3, 4, 5, 5, 6, 6, 6, 6, 9, 8 10

Para esta muestra, las modas son 3 y 6, ya que ambos valores se presentan el mismo nmero de veces, cuatro y ninguno otro lo hace con mayor frecuencia. En este caso se dice que los datos son bimodales .

19

CAPTULO 1. Conceptos generales de probabilidad

Tanto la mediana como la moda se puede calcular para datos agrupados las formulas son las siguientes: Dnde: ( )

Dnde:

Partiendo de los datos agrupados de la muestra de tamao 80 (n=8 ), de la aleacin aluminio-litio de la tabla 1-4. Encontrar: a) La media para datos agrupados. b) La mediana para datos agrupados. c) La moda para datos agrupados.

20

PROBABILIDAD Y ESTADISTICA

EJEMPLO 5.

CAPTULO 1. Conceptos generales de probabilidad

Solucin: Tensin ( psi ) 76 98 99 121 122 144 145 167 168 190 191 -213 214 -236 237 -259 TOTAL Nmero unidades ( probetas ) 3 7 10 25 20 9 4 2 80 de Frecuencia Acumulada 3 10 20 45 65 74 78 80

Marca de clase 87 110 133 156 179 202 225 248


Tabla 1-8

a.

b.
PROBABILIDAD Y ESTADISTICA

c. ( )

21

CAPTULO 1. Conceptos generales de probabilidad

1.8.4 Percentiles Y Cuartiles


La mediana (ya sea de una poblacin o de una muestra) divide los datos en dos partes iguales. Tambin es posible dividir los datos en ms de dos partes. Cuando se divide de un conjunto ordenado de datos en cuatro partes iguales, los puntos de divisin se conocen como cuartiles. El primer cuartil, o cuartil inferior, es un valor que tiene aproximadamente la cuarta parte (25%) de las observaciones por debajo de l, y el 75% restante, por encima de l. El segundo cuartil, tiene aproximadamente la mitad (50%) de las observaciones por debajo de l. El segundo cuartil es exactamente igual a la mediana. El tercer cuartil, o cuartil superior, tiene aproximadamente las tres cuartas partes (75%) de las observaciones por debajo de l. Al igual que en el caso de la mediana. EJEMPLO 6 Partiendo de los datos agrupados de la muestra de tamao 80 (n=80), de aleacin aluminio-litio de la tabla 1-4. Encontrar los cuartiles y los percentiles y

Tensin (psi) 76 98 99 121 122 144 145 167 168 190 191 213 214 - 236 237 259 TOTAL

Nmero de unidades (probetas) 3 7 10 25 20 9 4 2 80


Tabla 1-9

Solucin:

22

PROBABILIDAD Y ESTADISTICA

CAPTULO 1. Conceptos generales de probabilidad

a. Se busca en que clase o categora se indica el primer cuarto de los datos, es decir ( ) de los datos, sumando las frecuencias absolutas desde la primera clase hasta donde sea necesario. (3 + 7 + 10) = 20, el cuartil se encuentra en la tercera clase. ( )

Calculamos el lmite inferior real:

Por lo tanto, Entonces: y C = 23 ( )

b. Se busca la clase donde se ubique los

de los datos.

( (

) )
PROBABILIDAD Y ESTADISTICA

23

CAPTULO 1. Conceptos generales de probabilidad

c. para encontrar los porcentajes se dividen los datos en centsimas partes ( se aplica el mismo procedimiento de los cuartiles

), y

( ( (

) )

( (

) ) )

d.
PROBABILIDAD Y ESTADISTICA

24

CAPTULO 1. Conceptos generales de probabilidad

1.9 MEDIDAS DE VARIABILIDAD Se denominan medidas de tendencia central, aquellas que no solo proporcionan generalmente una descripcin satisfactoria de un conjunto de datos. Al menos estn interesados en los datos que desean con frecuencia tener tambin una medida de la manera en que los valores individuales se desvan del promedio. A sta clase de medidas se les conoce como MEDIDAS DE VARIABILIDAD la variabilidad tambin es denominada dispersin.

1.9.1Rango
Una de las medidas ms sencillas de variabilidad es el rango de la muestra, y se define como la diferencia entre la observacin grande y la pequea. La forma ms comn es:

Donde X max = grande observacin X min = pequea observacin La facilidad de clculo del rango de una muestra es evidente, sin embargo ste ignora toda la informacin que hay en la muestra entre la observacin ms grande y la ms pequea. Por ejemplo, si tenemos las siguientes muestras:

n = 5 (tamao de la muestra) Las dos muestras tienen el mismo valor de rango, sin embargo, en la segunda muestra solo existe variabilidad en los valores extremos, a diferencia que en la primera muestra el cambio se nota en los tres intermedios (esto no lo capta el ) Los valores extremos no son tan pequeos al aparecer en las muestras pequeas y s en las muestras grandes, en consecuencia, muestras pequeas tienden a tener rangos pequeos y los grandes rangos grandes. Para muestras pequeas (n <= 10), la perdida de informacin no es tan relevante; en control de calidad estadstica las muestras son de tamao cuatro o cinco,por lo tanto se aconseja el rango como medida de variabilidad.

25

PROBABILIDAD Y ESTADISTICA

CAPTULO 1. Conceptos generales de probabilidad

En general, lo que se desea es tener una medida de variabilidad que depende de todas las observaciones y no de una pequea parte, como ocurre con el rango.

1.9.2Varianza
Las limitaciones del rango se pretenden evitar con otras medidas de variabilidad conocidas como varianza y desviacin estndar. La desviacin estndar es la raz cuadrada positiva de la varianza. La varianza se puede calcular para la muestra o para toda la poblacin, cuando esta es infinita y est formada por N variables, las frmulas adecuadas son: ( ( ) ) ( ) ( ) ( )

) ( ) ) ( ) )
PROBABILIDAD Y ESTADISTICA

( (

Las unidades de medicin de la varianza son iguales al cuadrado de las unidades con que se mide la variable. De esta manera, si X se mide en lbs, las unidades de , ser la desviacin estndar tiene la ventaja de medirse en las unidades originales de la variable de inters, X

26

CAPTULO 1. Conceptos generales de probabilidad

EJEMPLO 7 Dos mquinas en una lnea de produccin producen el mismo artculo, la produccin para cada una es de 100 unidades. Un inspector de control de calidad desea conocer la variabilidad de cada mquina; para esto establece la diferencia en centmetros entre el largo de la pieza producida, contra el largo de la pieza prototipo, como variable de control.

La mquina A dio los siguientes resultados: # de piezas 30 40 30 100

1 2 3 Totales

30 160 270 460

30 80 90 200

La mquina B dio los siguientes resultados: # de piezas 20 10 30 30 10 100

0 1 2 3 4 Totales Solucin:

0 10 120 270 160 560

0 10 60 90 40 200
PROBABILIDAD Y ESTADISTICA

Si encontramos la medida y la varianza de la maquina A ( ( ) ) ( ) ( ( ) ) ( )

Si encontramos la media y la varianza de la maquina B

27

CAPTULO 1. Conceptos generales de probabilidad

Para las dos mquinas las piezas tienen un promedio 2.0 cm de diferencia por debajo con respecto al patrn o prototipo, pero la mquina B exhibe una mayor variabilidad.

1.9.3Coeficiente De Variacin
En ocasiones es deseable expresar la variacin como una funcin de la media. Para hacer esto se utiliza una medida adimensional de la variacin relativa, denominada coeficiente de variacin muestral. El coeficiente de variacin muestral es: El coeficiente de variacin es til cuando se compara la variabilidad de dos (2) o ms conjuntos de datos que difieren de manera considerable en la magnitud de las observaciones. EJEMPLO 8: Con un micrmetro, se realizan mediciones del dimetro de un tornillo, que tiene una media 4.03 mm y una desviacin estndar de 0.012 mm; con otro micrmetro se toman mediciones de la longitud del tornillo, la media de la longitud es de 1.76 pulgadas y una desviacin estndar de 0.0075 pulgadas. Los coeficientes de variacin son:
PROBABILIDAD Y ESTADISTICA

En consecuencia, las mediciones hechas con el primer micrmetro exhiben una variabilidad relativamente menor que las efectuadas con el otro micrmetro.

28

CAPTULO 1. Conceptos generales de probabilidad

1.9.4 Medidas De Asimetra Y Apuntamiento


Los conceptos de asimetra (sesgo) y apuntamiento hacen referencia a la comparacin de la obtenida (polgono de frecuencia) con los datos provenientes de la muestra (n) y una curva terica o normal, observada en la mayora de los fenmenos naturales, en especial cuando el nmero de observaciones es grande. Una distribucin es simtrica, cuando la media, la mediana y la moda son iguales, es decir, cuando su polgono de frecuencia tiene su simtrico o normal, en este caso sus dos colas son iguales.

Media=Mediana=Moda

Pero si la distribucin unidimensional tiene una cola ms larga hacia uno de los lados, se dice que es asimtrica a deforme. Si la deformacin o alargamiento de la cola se presenta hacia valores ms grandes de la variable, es decir, hacia la derecha se dir Que la distribucin es asimtrica positiva, en caso contrario la asimetra ser negativa.
PROBABILIDAD Y ESTADISTICA

Simtrica

Asimtrica positiva

Asimtricanegativa

29

CAPTULO 1. Conceptos generales de probabilidad

1.9.4.1Sesgo
Se conoce como sesgo al grado de asimetra de una distribucin, es decir cunto se aparta de la simetra. La asimetra os sesgo se representa por ( ) ( )

Momento 3 con respecto a la media para datos no agrupados

Momento 3 con respecto a la media para datos agrupados

La curva normal es el referente terico y no tiene sesgo ( una distribucin puede ser: > 0 asimtrica positiva = 0 simtrica < 0 asimtrica negativa

); entonces el sesgo de

1.9.4.2 Apuntamiento
Es tambin conocido como curtosis y permite establecer el grado de apuntamiento o achatamiento de la curva o polgono de frecuencia; la curva normal tiene ; la frmula es:

)
PROBABILIDAD Y ESTADISTICA

>3 =3 <3

Para el ejemplo de la aleacin aluminio-litio

30

CAPTULO 1. Conceptos generales de probabilidad

Tension Psi 76 - 98 99 - 121 122 144 145 167 168 190 191 213 214 236 237 259

Numero de probetas (Fi) 3.00 7.00 10.00 25.00 20.00 9.00 4.00 2.00

Frecuencia Absoluta Acumulada 3.00 10.00 20.00 45.00 65.00 74.00 78.00 80.00

mi

Fi(mi -X )3

Fi(mi -X )4

87.00 1,326,699.07 101,077,885.14 110.00 1,053,238.61 56,019,128.70 133.00 -275,094.21 8,304,406.36 156.00 -9,282.68 66,719.29 179.00 79,073.62 1,250,351.59 202.00 526,207.90 20,423,444.03 225.00 944,689.13 58,393,596.84 248.00 1,220,139.79 103,483,106.07 105,795.87 349,018,638.02
Tabla 1-8

( ( )

El sesgo para el ejemplo de la aleacin litio-aluminio nos indica que el polgono de frecuencias es bastante simtrico con una ligera hacia la derecha y el apuntamiento o curtosis es casi 3. (Ver Figura 1-1) 1.9.4.3Conceptos Importantes Y Terminologa
PROBABILIDAD Y ESTADISTICA

Estadstica Estadstica descriptiva Estadstica inferencial Variable Variable aleatoria Variable contina Variable discreta Variable cuantitativa Variable cualitativa Poblacin Muestra Distribucin de frecuencia absoluta Distribucin de frecuencia acumulada absoluta

Distribucin de frecuencia acumulada relativa Polgono de frecuencia Media Mediana Moda Varianza Cuartiles Percentiles Coeficiente de variacin Sesgo Curtos

31

CAPTULO 1. Conceptos generales de probabilidad

32

PROBABILIDAD Y ESTADISTICA

Potrebbero piacerti anche