Sei sulla pagina 1di 16

Qu Es Estadstica?

La Estadstica es una ciencia formal que estudia la recoleccin, anlisis e interpretacin de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algn fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadstica es ms que eso, es decir, es el Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en reas de negocios o instituciones gubernamentales.

Qu Es La Estadstica Descriptiva?
La estadstica descriptiva es una gran parte de la estadstica que se dedica a recolectar, ordenar, analizar y representar un conjunto de datos, con el fin de describir apropiadamente las caractersticas de ese conjunto. Este anlisis es muy bsico. Aunque hay tendencia a generalizar a toda la poblacin, las primeras conclusiones obtenidas tras un anlisis descriptivo, es un estudio calculando una serie de medidas de tendencia central, para ver en qu medida los datos se agrupan o dispersan en torno a un valor central. Esto es lo que podra ser un concepto aproximado.

Qu Es Una Distribucin De Frecuencias?


Una distribucin de frecuencias es un formato tabular en la que se organizan los datos en clases, es decir, en grupos de valores que describen una caracterstica de los [datos] y muestra el nmero de observaciones del conjunto de datos que caen en cada una de las clases. La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numrico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el nmero de veces que aparece, es decir, su Frecuencia. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la frecuencia simple y la frecuencia acumulada. La tabla de frecuencias puede representarse grficamente en un histograma (Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los intervalos de valores. La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.

Qu Son Las Medidas De Tendencia Central?

Al describir grupos de observaciones, con frecuencia es conveniente resumir la informacin con un solo nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la distribucin de datos se denomina medida o parmetro de tendencia central o de centralizacin. Cuando se hace referencia nicamente a la posicin de estos parmetros dentro de la distribucin, independientemente de que sta est ms o menos centrada, se habla de estas medidas 1 como medidas de posicin. En este caso se incluyen tambin los cantiles entre estas medidas. Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que las medidas de posicin o medidas de tendencia se usan de acuerdo al tipo de variable que se est observando, en este caso se observan variables cuantitativas. Entre las medidas de tendencia central tenemos: Media . Media ponderada. Media geomtrica. Media armnica. Mediana. Moda.

La media aritmtica (o simplemente media)


Artculo principal: Media aritmtica.

La media aritmtica es el valor obtenido por la suma de todos sus valores dividida entre el nmero de sumandos.

Por ejemplo, las notas de 5 alumnos en una prueba:

Nio 1 2 3 4 5

nota 6,0 5,4 3,1 7,0 6,1 Primero, se suman las notas: 6,0+5,4+3,1+7,0+6,1 = 27,6 Luego el total se divide entre la cantidad de alumnos: 27,6/5=5,52

La media aritmtica en este ejemplo es 5,52 La media aritmtica es, probablemente, uno de los parmetros estadsticos ms extendidos. Se le llama tambin promedio o, simplemente, media.
2

Qu Es Poblacin?
Poblacin humana, en sociologa y biologa, es el grupo de personas que vive en un rea o espacio geogrfico. Para la demografa, centrada en el estudio estadstico de las poblaciones humanas, la poblacin es un conjunto renovado en el que entran nuevos individuos 3 -por nacimiento o inmigracin- y salen otros -por muerte o emigracin-. La poblacin total de un territorio o localidad se determina por procedimientos estadsticos y mediante el censo de poblacin. La evolucin de la poblacin y su crecimiento o decrecimiento, no solamente estn regidos por el balance de nacimientos y muertes, sino tambin por el balance migratorio, es decir, la diferencia 4 entre emigracin e inmigracin; la esperanza de vida y el solapamiento intergeneracional. Otros aspectos del comportamiento humano de las poblaciones se estudian en sociologa, economa y geografa, en especial en la geografa de la poblacin y en la geografa humana.

Qu Es Variable?
Una variable es una caracterstica que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores. Existen diferentes tipos de variables: Variables cualitativas Son las variables que expresan distintas cualidades, caractersticas o modalidad. Cada modalidad que se presenta se denomina atributo o categora y la medicin consiste en una clasificacin de dichos atributos. Las variables cualitativas pueden ser dicotmicas cuando slo pueden tomar dos valores posibles como s y no, hombre y mujer o son politmicas cuando pueden adquirir tres o ms valores. Dentro de ellas podemos distinguir: Variable cualitativa ordinal o variable cuasi cuantitativa: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, grave. Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores.

Variables cuantitativas Son las variables que se expresan mediante cantidades numricas. Las variables cuantitativas adems pueden ser: Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores especficos que la variable pueda asumir. Ejemplo: El nmero de hijos (1, 2, 3, 4, 5).

Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,...), o el salario. Solamente se est limitado por la precisin del aparato medidor, en teora permiten que siempre exista un valor entre dos variables.

Qu Es Muestra?
En estadstica una muestra estadstica (tambin llamada muestra aleatoria o simplemente muestra) es un subconjunto de casos o individuos de una poblacin estadstica. Las muestras se obtienen con la intencin de inferir propiedades de la totalidad de la poblacin, para lo cual deben ser representativas de la misma. Para cumplir esta caracterstica la inclusin de sujetos en la muestra debe seguir una tcnica de muestreo. En tales casos, puede obtenerse una informacin similar a la de un estudio exhaustivo con mayor rapidez y menor coste (vanse las ventajas de la eleccin de una muestra, ms abajo). Por otra parte, en ocasiones, el muestreo puede ser ms exacto que el estudio de toda la poblacin porque el manejo de un menor nmero de datos provoca tambin menos errores en su manipulacin. En cualquier caso, el conjunto de individuos de la muestra son los sujetos realmente estudiados. El nmero de sujetos que componen la muestra suele ser inferior que el de la poblacin, pero suficiente para que la estimacin de los parmetros determinados tenga un nivel de confianza adecuado. Para que el tamao de la muestra sea idneo es preciso recurrir a su clculo.

Qu Es Variabilidad?
Uno de los principales objetivos de los modelos estadsticos y, en particular, de los modelos de diseo de experimentos, es controlar la variabilidad de un proceso estocstico que puede tener diferente origen. De hecho, los resultados de cualquier experimento estn sometidos a tres tipos de variabilidad cuyas caractersticas son las siguientes:

Variabilidad sistemtica y planificada. Esta variabilidad viene originada por la posible dispersin de los resultados debida a diferencias sistemticas entre las distintas condiciones experimentales impuestas en el diseo por expreso deseo del experimentador. Es el tipo de variabilidad que se intenta identificar con el diseo estadstico. Cuando este tipo de variabilidad est presente y tiene un tamao importante, se espera que las respuestas tiendan a agruparse formando grupos (clster). Es deseable que exista esta variabilidad y que sea identificada y cuantificada por el modelo.

Variabilidad tpica de la naturaleza del problema y del experimento. Es la variabilidad debida al ruido aleatorio. Este trmino incluye, entre otros, a la componente de variabilidad no planificada denominada error de medida. Es una Variabilidad impredecible e inevitable. Esta variabilidad es la causante de que si en un laboratorio se toman medidas repetidas de un mismo objeto ocurra que, en muchos casos, la segunda medida no sea igual a la primera y, ms an, no se puede predecir sin error el valor de la tercera. Sin embargo, bajo el aparente caos, existe un patrn regular de comportamiento en esas medidas: todas ellas tendern a fluctuar en torno a un valor central y siguiendo un modelo de probabilidad que ser importante estimar. Esta variabilidad es inevitable pero, si el experimento ha sido bien planificado, es posible estimar (medir) su valor, lo que es de gran importancia para obtener conclusiones y poder hacer predicciones. Es una variabilidad que va a estar siempre presente pero que es tolerable.

Variabilidad sistemtica y no planificada. Esta variabilidad produce una variacin sistemtica en los resultados y es debida a causas desconocidas y no planificadas. En otras palabras, los resultados estn siendo sesgados sistemticamente por causas desconocidas. La presencia de esta variabilidad supone la principal causa de conclusiones errneas y estudios incorrectos al ajustar un modelo estadstico. Como se estudiar posteriormente, existen dos estrategias bsicas para tratar de evitar la presencia de este tipo de variabilidad: la aleatorizacin y la tcnica de bloques. Este tipo de variabilidad debe de intentar evitarse y su presencia lleva a conclusiones errneas.

Qu Es Sesgo?
En estadstica se llama sesgo de un estimador a la diferencia entre su esperanza matemtica y el valor numrico del parmetro que estima. Un estimador cuyo sesgo es nulo se llama insesgado o centrado. En notacin matemtica, dada una muestra parmetro muestral , el sesgo es: y un estimador del

El no tener sesgo es una propiedad deseable de los estimadores. Una propiedad relacionada con sta es la de la consistencia: un estimador puede tener un sesgo pero el tamao de ste converge a cero conforme crece el tamao muestral.

Dada la importancia de la falta de sesgo, en ocasiones, en lugar de estimadores naturales se utilizan otros corregidos para eliminar el sesgo. As ocurre, por ejemplo, con la varianza muestral.

Fuentes del sesgo en las ciencias experimentales


En el diseo y elaboracin de un estudio de investigacin en clnica, puede haber distintos tipos de sesgos: de seleccin: debido a que los grupos no comparables a causa de cmo se eligieron los pacientes o sujetos. de informacin: debido a que los grupos no comparables a causa de cmo se obtuvieron los datos. de confusin: debido a una mezcla de efectos debido a una tercera variable (variable de confusin).

Que Son Datos Agrupados?


Su fin es resumir la informacin. Generalmente, los elementos son de mayor tamao, por lo cual requieren ser agrupados, esto implica: ordenar, clasificar y expresar los en una tabla de frecuencias. Se agrupa a los datos, si se cuenta con 20 o ms elementos. Aunque contemos con ms de 20 elementos, debe de verificarse que los datos n sean significativos, Esto es: que la informacin sea repetitiva, tambin debemos de verificar que los datos puedan clasificarse. Y que dicha clasificacin tiene coherencia y lgica (de acuerdo a lo que se nos esta pidiendo). Una vez que ya hemos ordenado y clasificado, presentaremos la informacin obtenida mediante unatabla de frecuencias La agrupacin de los datos puede ser simple o mediante intervalos de clase. Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al intervalo, pero el lmite superior no pertenece intervalo, se cuenta en el siguiente intervalo. Ci [0, 5) [5, 10) [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) [35, 40) [40, 45) [45, 50) Total: 2.5 1 7.5 12.5 17.5 22.5 27.5 32.5 37.5 42.5 47.5 fi 1 1 3 3 3 6 7 10 4 2 Fi 2 5 8 11 17 24 34 38 40 ni 0.025 Ni 0.025 0.025 0.075 0.075 0.075 0.150 0.175 0.250 0.100 0.050 1 0.050 0.125 0.200 0.2775 0.425 0.600 0.850 0.950 1

Qu Son Datos No Agrupados?


7, 7, 6, 7,5, 6, 7, 89,8 Tienes: 5 aparece una vez 6 aparece 2 veces 7 aparece 4 veces 8 aparece una vez 89 aparece una vez. Esto seria para los datos sueltos, incluso lo puedes graficar de esa forma. Si quieres, puedes agrupar los datos en intervalos de igual longitud. Esto lo haces viendo cuantos datos tienes y distribuyendo aproximadamente en raz de N intervalos, donde N es el nmero de datos. En este caso son 9 datos, entonces debe haber 3 intervalos (o clases). Para calcular la longitud del intervalo (o ancho de clase), divides el rango de los datos (que es el mayor dato menos el menor dato) entre el numero de intervalos. En este caso, el rango es 89 - 5 = 84, y hay 3 intervalos, por lo tanto la longitud del intervalo es 84/3 = 28. Entonces tus intervalos te quedan: de 5 a 33 de 33 a 61 de 61 a 89 y tus datos agrupados serian de 5 a 33 tienes 8 datos de 33 a 61 tienes 0 datos de 61 a 89 tienes 1 dato. Tienes ambas opciones: hacer una distribucin individual o una distribucin agrupada con tus datos sueltos.

Qu Son Medidas De Dispersin?


Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la mediana media. As se sabe si todos los casos son parecidos o varan mucho entre ellos. Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviacin media) y otra es tomando las desviaciones al cuadrado (Varianza).

Que Es La Media Estadstica?


Es la medida de posicin central ms utilizada, la ms conocida y la ms sencilla de calcular, debido principalmente a que sus ecuaciones se prestan para el manejo algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica en su sensibilidad al cambio de uno de sus valores o a los valores extremos demasiado grandes o pequeos. La media se define como la suma de todos los valores observados, dividido por el nmero total de observaciones.

Ecuacin 5-1 Cuando los valores representan una poblacin la ecuacin se define como:

Ecuacin 5- 2 Donde (m) representa la media, (N) representa el tamao de la poblacin y (Xi) representa cada uno de los valores de la poblacin. Ya que en la mayora de los casos se trabajan con muestras de la poblacin todas las ecuaciones que se presenten a continuacin sern representativas para las muestras. La media aritmtica para una muestra esta determinada como

Ecuacin 5-3 Donde (X) representa la Media para la muestra, (n) el tamao de la muestra y (Xi) representa cada uno de los valores observados. Esta frmula nicamente es aplicable si los datos se encuentran desagrupados; en caso contrario debemos calcular la media mediante la multiplicacin de los diferentes valores por la frecuencia con que se encuentren dentro de la informacin; es decir,

Ecuacin 5-4 Donde (Yi) representa el punto medio de cada observacin, (ni) es la frecuencia o nmero de observaciones en cada clase y (n) es el tamao de la muestra siendo igual a la suma de las frecuencias de cada clase. Para entender mejor este concepto vamos a suponer que hemos tomado la edad de 5 personas al azar cuyos resultados fueron (22, 33, 35, 38 y 41). Para facilitar su interpretacin se han generado tres rangos de edad los cuales se han establecido de 21 a 30 aos, de 31 a 40 aos y de 41 a 50 aos. Si nos fijamos en estos rangos notaremos que los puntos medios son 25, 35 y 45 respectivamente. Los resultados de la organizacin de estos datos se representan en la tabla [5-1].

Figura 5-1 Si aplicamos la frmula para valores agrupados obtendramos que la media es igual a

Lo que nos indicara que el promedio de edad de los encuestados es de 35 aos. Si ha estos mismos resultados le aplicamos la ecuacin para datos desagrupados (Ecuacin 5-3), tomando como referencia cada uno de los valores individuales, obtendramos que la media es igual a

Lo que nos indicara que el promedio de edad para los datos desagrupados es de 34 aos aproximadamente. Esta diferencia se debe a que al agrupar los datos se pierde parcialmente la exactitud de los clculos, principalmente al aumentar el nmero de datos. Para evitar estos inconvenientes, SPSS nos permite calcular las Medias, como si se trataran de valores desagrupados, aunque tiene algunos procedimientos para valores agrupados. Es importante resaltar que existe una gran variedad de medias como la Media geomtrica, la Media ponderada, la Media cuadrtica, etc. Por el momento slo hacemos nfasis en la media aritmtica ya que es la ms utilizada, aunque se recomienda a los lectores profundizar en estos temas.

Qu Es La Moda Estadstica?
La medida modal nos indica el valor que ms veces se repite dentro de los datos; es decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que ms veces se repite es el nmero 2 quien seria la moda de los datos. Es posible que en algunas ocasiones se presente dos valores con la mayor frecuencia, lo cual se denomina Bimodal o en otros casos ms de dos valores, lo que se conoce como multimodal. En conclusin las Medidas de tendencia central, nos permiten identificar los valores ms representativos de los datos, de acuerdo a la manera como se tienden a concentrar. La Media nos indica el promedio de los datos; es decir, nos informa el valor que obtendra cada uno de los individuos si se distribuyeran los valores en partes iguales. La Mediana por el contrario nos informa el valor que separa los datos en dos partes iguales, cada una de las cuales cuenta con el cincuenta porciento de los datos. Por ltimo la Moda nos indica el valor que ms se repite dentro de los datos.

Qu Es Media Estadstica?
Con esta medida podemos identificar el valor que se encuentra en el centro de los datos, es decir, nos permite conocer el valor que se encuentra exactamente en la mitad del conjunto de datos despus que las observaciones se han ubicado en serie ordenada. Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del mismo. Para determinar la posicin de la mediana se utiliza la frmula

Ecuacin 5-5 Para comprender este concepto vamos a suponer que tenemos la serie ordenada de valores (2, 5, 8, 10 y 13), la posicin de la mediana sera:

Lo que nos indica que el valor de la mediana corresponde a la tercera posicin de la serie, que equivale al nmero (8). Si por el contrario contamos con un conjunto de datos que contiene un nmero par de observaciones, es necesario promediar los dos valores medios de la serie. Si en el ejemplo anterior le anexamos el valor 15, tendramos la serie ordenada (2, 5, 8, 10, 13 y 15) y la posicin de la mediana sera,

Es decir, la posicin tres y medio. Dado que es imposible destacar la posicin tres y medio, es necesario promediar los dos valores de la posiciones tercera y cuarta para producir una mediana equivalente, que para el caso corresponden a (8 + 10)/2 =9. Lo que nos indicara que la mitad de los valores se encuentra por debajo del valor 9 y la otra mitad se encuentra por encima de este valor. En conclusin la mediana nos indica el valor que separa los datos en dos fracciones iguales con el cincuenta porciento de los datos cada una. Para las muestras que cuentan con un nmero impar de observaciones o datos, la mediana dar como resultado una de las posiciones de la serie

ordenada; mientras que para las muestras con un nmero par de observaciones se debe promediar los valores de las dos posiciones centrales.

Qu Son Cuartiles?
Los cuartiles son medidas estadsticas de posicin que tienen la propiedad de dividir la serie estadstica en cuatro grupos de nmeros iguales de trminos. De manera similar los deciles dividen a la serie en diez partes iguales y los percentiles dividen a los trminos de la serie en cien grupos iguales. As como la mediana divide la serie o distribucin en dos partes iguales, existen tres cuartiles, nueve deciles y noventa y nueve percentiles que dividen en cuatro, diez y cien partes iguales a la distribucin. De estas tres ltimas medidas de posicin los cuartiles son las de mayor aplicacin. Se emplean generalmente en la determinacin de estratos o grupos correspondientes a fenmenos socio-econmicos, monetarios o tericos. Los tres cuartiles suelen designarse con los smbolos: Q1 = primer cuartil Q2 = segundo cuartil Q3 = tercer cuartil

Qu Son Percentiles?
Los percencentiles, que dividen a la distribucin de datos, nmeros, en cien partes. Se representan con la letra P. Es el percentil i-simo, donde la i toma valores del 1 al 99. El i % de la muestra son valores menores que l y el 100-i % restante son mayores. Cuando los datos no estn agrupados en intervalos, los cuartiles, as como el resto de las medidas de posicin, tienen un valor claro. Sin embargo, cuando tenemos una agrupacin de los datos ya no es tan sencillo realizar el clculo. S que resulta claro ver en cul de los intervalos est el cuartil (quintil, decil o percentil) buscado, pero para calcular su valor exacto necesitaremos usar una frmula. EJEMPLO EN EXCEL (Para que lo entiendas mejor) Los percentiles de un conjunto de datos son calculados con la instruccin perctl. A esta instruccin hay que introducirle dos vectores. Uno de ellos x debe contener los datos que queremos procesar y en el otro y, valores enteros comprendidos entre el 1 y el 100. La funcin calcula cuales son los valores de x que se corresponden con los percentiles indicados en y. Para probar esta funcin vamos a introducir un vector x que contenga el conjunto de datos con el que queremos trabajar: x =[ 7, 12, 4, 8, 3, 10, 11, 5, 13, 1, 12, 3, 5, 1, 17, 4, 8, 8, 7, 19, 8, 1, 7, 17, 4, 7, 1, 7, 3, 7, 3, 13, 3, 4, 7, 8, 10, 2, 5, 11, 5, 4, 3, 5, 8 ]; y = [15, 25, 60, 80 ] Con esto calcularemos los percentiles 15, 25, 60 y 80 del conjunto de datos del vector x

prctile(x,y) ans = 3. 43. 3.5 5. 7. 19. 10.8 6. Nos devuelve una matriz de dos columnas. En la primera de ellas aparecen los valores de los percentiles pedidos y en la segunda aparece la posicin que ocupan en el vector x dichos valores.

Qu es Rango Estadstico?
En estadstica descriptiva se denomina rango estadstico (R) o recorrido estadstico al intervalo a la diferencia entre el valor mximo y el valor mnimo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersin de los datos, cuanto mayor es el rango, ms dispersos estn los datos de un conjunto. Por ejemplo, para una serie de datos de carcter cuantitativo, como lo es la estatura medida en centmetros, tendramos:

Es posible ordenar los datos como sigue:

Donde la notacin x (i) indica que se trata del elemento i-simo de la serie de datos. De este modo, el rango sera la diferencia entre el valor mximo (k) y el mnimo; o, lo que es lo mismo:

En nuestro ejemplo, con cinco valores, nos da que R = 185-155 = 30.

Qu Es Desviacin Estndar?
La desviacin estndar o desviacin tpica (denotada con el smbolo o s, dependiendo de la procedencia del conjunto de datos) es una medida de centralizacin o dispersin para variables de razn (ratio o cociente) y de intervalo, de gran utilidad en la estadstica descriptiva. Se define como la raz cuadrada de la varianza. Junto con este valor, la desviacin tpica es una medida (cuadrtica) que informa de la media de distancias que tienen los datos respecto de su media aritmtica, expresada en las mismas unidades que la variable. Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer tambin la desviacin que presentan los datos en su distribucin respecto de la media aritmtica de dicha distribucin, con objeto de tener una visin de los mismos ms acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones. La desviacin estndar es una medida del grado de dispersin de los datos con

respecto al valor promedio. Dicho de otra manera, la desviacin estndar es simplemente el "promedio" o variacin esperada con respecto a la media aritmtica. Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estndar mustrales son 8.08, 5.77 y 1.15respectivamente. La tercera muestra tiene una desviacin mucho menor que las otras dos porque sus valores estn ms cerca de 7. La desviacin estndar puede ser interpretada como una medida de incertidumbre. La desviacin estndar de un grupo repetido de medidas nos da la precisin de stas. Cuando se va a determinar si un grupo de medidas est de acuerdo con el modelo terico, la desviacin estndar de esas medidas es de vital importancia: si la media de las medidas est demasiado alejada de la prediccin (con la distancia medida en desviaciones estndar), entonces consideramos que las medidas contradicen la teora. Esto es coherente, ya que las mediciones caen fuera del rango de valores en el cual sera razonable esperar que ocurrieran si el modelo terico fuera correcto. La desviacin estndar es uno de tres parmetros de ubicacin central; muestra la agrupacin de los datos alrededor de un valor central (la media o promedio).

Qu Es Varianza?
En teora de probabilidad, la varianza (que suele representarse como ) de una variable aleatoria es una medida de dispersin definida como la esperanza del cuadrado de la desviacin de dicha variable respecto a su media. Est medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. La desviacin estndar, es la raz cuadrada de la varianza, es una medida de dispersin alternativa expresada en las mismas unidades de los datos de la variable objeto de estudio. La varianza tiene como valor mnimo 0. Hay que tener en cuenta que la varianza puede verse muy influida por los valores atpicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de dispersin ms robustas. El trmino varianza fue acuado por Ronald Fisher en un artculo de 1918 titulado The Correlation Between Relatives on the Supposition of Mendelian Inheritance.

Qu Es Regresin Lineal?
En estadstica la regresin lineal o ajuste lineal es un mtodo matemtico que modela la relacin entre una variable dependiente Y, las variables independientes Xi y un trmino aleatorio . Este modelo puede ser expresado como:

: Variable dependiente, explicada o regresando. : Variables explicativas, independientes o regresores.

: Parmetros, miden la influencia que las variables explicativas tienen sobre el regresando. Donde es la interseccin o trmino "constante", las son los parmetros respectivos a cada variable independiente, y es el nmero de parmetros independientes a tener en cuenta en la regresin. La regresin lineal puede ser contrastada con la regresin no lineal.

Qu Es El Coeficiente De Correlacin?
Bsicamente el coeficiente de correlacin es una medida que indica que tan asociadas estn las variables dependiente e independiente en un modelo de regresin lineal, o de manera similar explica, junto con el coeficiente de de determinacin( que es el cuadrado del coeficiente de correlacin) que tanto depende realmente Y de X, ahora, si el valor del coeficiente de correlacin es cercano a 1 o a -1 indicar que la variable dependiente si esta relacionada de manera directa o inversamente proporcional con la variable independiente y el modelo tiene funcionalidad, pero si el coeficiente esta cercano a cero indicar que las variables son independientes y por lo tanto que el modelo no funciona con esas variables, o que el modelo lineal no es el adecuado para realizar inferencias acerca de una tendencia determinada. En el contexto del anlisis de la regresin lineal simple el coeficiente de correlacin mltiple establece una medida del grado de asociacin lineal entre la variable respuesta y la variable predictora, concretamente entre la variable respuesta y la recta de regresin estimada. Se define, a partir de la n pares de observaciones, mediante

Su cuadrado, R , denominado coeficiente de determinacin mltiple, puede interpretarse como el porcentaje de variabilidad de Y explicada o debida a la recta de regresin, en tanto que puede comprobarse que

Cuando todos los puntos se encuentran sobre la recta de regresin estimada, es decir, "el ajuste 2 es perfecto", la suma de cuadrados de residuos, SSE, toma el valor cero y, por tanto, R = 1. El denominador de la ltima expresin es una medida de la variabilidad total de las n observaciones de la variable respuesta.

Introduccin
La presente investigacin se refiere al tema de DISTRIBUCION DE FRECUENCIAS el cual investigue a fondo y me pareci interesante, ya que esto me ensea a calcular cierto porcentaje o nmero de cualquier dato, y sus procedimientos son fciles de entender.

Conclusin
Puedo decir que en esta investigacin se aclararon mis dudas de lo que era la materia de estadstica y que ya le entiendo un poco ms. Ya que ciertos temas los tendr que ver en cualquier ramo laboral que desempee en un futuro.

Potrebbero piacerti anche