Sei sulla pagina 1di 6

ESTADSTICA DESCRIPTIVA La Estadstica es una disciplina que se aplica en muchos campos de la actividad del ser humano.

Es muy frecuente encontrarse en las diferentes disciplinas del saber con incertidumbres como el pronosticar el crecimiento poblacional de un pas, el crecimiento econmico de una empresa o el crecimiento de produccin y venta de un producto especfico, el conocer la efectividad de diferentes abonos en el campo agrario, el determinar la tendencia de contaminacin del agua o el aire, la clasificacin de personal en una empresa para efectos de una buena y sana poltica laboral, etc. Empricamente se sabe que la Estadstica tiene que ver con datos y la manera en que estos son agrupados. Que es Estadstica: es un mtodo cientfico de operar con un grupo de datos y de interpretarlos. La Inferencia Estadstica comprende en un todo articulado el mtodo y las tcnicas necesarias para explicar el comportamiento de un grupo de datos en un nivel superior de lo que estos datos pueden dar a conocer por s mismos. la Estadstica Descriptiva: Esta tiene por fin elevar los aspectos caractersticos del grupo de datos pero sin intentar obtener ms conocimiento del que pueda adquirirse por s mismos. Poblacin es el conjunto de medidas, individuos u objetos que comparten una caracterstica en comn. La poblacin se basa en cuatro caractersticas: contenido, tipo de unidades y elementos, ubicacin espacial y ubicacin temporal. De la poblacin es extrada la muestra. Muestra es un conjunto de elementos extrados de la poblacin. Los resultados obtenidos en la muestra sirven para estimar los resultados que se obtendran con el estudio completo de la poblacin. La unidad estadstica es el elemento de la poblacin que reporta la informacin y sobre el cul se realiza un determinado anlisis. Los datos son todas aquellas caractersticas o valores susceptibles de ser observados, clasificados y contados. Variable es una caracterstica susceptible de tener distintos valores en los elementos de un grupo o conjunto. Si la variable tiene la capacidad de tomar cualquier valor que exista entre dos magnitudes dadas, entonces esta variable ser continua. Si por el contrario, slo puede tener un valor de entre cierta cantidad de valores dados, entonces ser discreta. Parmetro son aquellos valores que caracterizan numricamente a la poblacin como tal. un estadstico es una magnitud correspondiente a una muestra aleatoria extrada de la poblacin, por lo que cambiando la muestra cambiar entonces el estadstico. En pocas palabras se puede decir que parmetro es a poblacin como estadstico es a muestra. Muestra aleatoria simple Si cada posible muestra de la poblacin, del mismo tamao, tiene igual probabilidad de ser seleccionad. Muestra Aleatoria sistemtica Cuando los elementos son seleccionados de una manera ordenada Muestra Aleatoria Estratificada Cuando la seleccin tiene en cuenta los diferentes grupos o estratos que conforman la poblacin. Una variable es una caracterstica que va a sr estudiada en una poblacin, Una variable es estadstica, si se puede escribir como una pregunta cuyas respuestas pueden ser tabuladas o clasificadas en determinados rangos UNA VARIABLE ES CUALITATIVA si en la caracterstica que se va a estudiar se busca conocer gustos, preferencias u opiniones. Cuando una variable es cualitativa es necesario determinar las posibles respuestas VARIABLES CUANTITATIVAS Una variable es cuantitativa si la caracterstica que se va a estudiar se pude medir en una escala numrica.

Si la variable tiene la capacidad de tomar cualquier valor que exista entre dos magnitudes dadas, entonces esta variable ser continua. Si por el contrario, slo puede tener una valor de entre cierta cantidad de valores dados, entonces ser discreta. Una escala es la relacin numrica entre la longitud real y la longitud que se asigna en el plano en el cual se va a representar su grfica. Para caracterizar una variable cualitativa se utilizan tres herramientas:

TABLAS DE FRECUENCIAS: Una distribucin o tablas de frecuencias es un resumen de los datos en el cual, cada opcin de respuesta de la variable se relaciona con el nmero de datos correspondiente. Una tabla de frecuencia contiene: Clases: que corresponde a opiniones, gustos, preferencias, cualidades o caractersticas. Frecuencia f: es el nmero de datos que pertenece a cada clase Frecuencia Relativa: es el cociente entre la frecuencia y el nmero total de datos, se simboliza fr . La frecuencia relativa representa un porcentaje, que se haya multiplicado por 100 al cociente indicado de la frecuencia relativa. MODA La moda es el dato que tiene mayor frecuencia, es decir, el dato que ms se repite. CAPITULO 2 .INVESTIGACIN ESTADSTICA PLANEACIN La planeacin de una investigacin estadstica debe abarcar el conjunto de lineamientos, procedimientos y acciones que conlleven a la resolucin satisfactoria para la cual se estableci la investigacin. Definicin del objeto de investigacin Debe responder el qu, el cmo y establecer el momento correcto para hacerse, debe tambin restringir el espacio fsico o geogrfico donde se llevar a cabo. Unidad de investigacin Se trata del elemento de la poblacin que origina la informacin Clase de investigacin En la planeacin, debe tambin tenerse en cuenta el tipo de investigacin que se va a realizar Las fuentes de informacin Despus de determinar el qu y el porqu de la investigacin estadstica, se debe preguntar el dnde conseguir la informacin requerida. Se trata entonces de definir las fuentes de informacin RECOLECCIN Despus de planeada la investigacin, comienza la recoleccin de los datos. Esta consiste en un conjunto de operaciones de toma de datos que puede ser por observacin, por encuesta o tomada de publicaciones y/o fuentes confiables que han efectuado investigaciones estadsticas. Segn la cobertura Se trata de decidir si se va a estudiar a la poblacin en su totalidad o slo una parte de ella. Segn la forma de observacin En este mtodo se tiene en cuenta la forma de medicin del dato.El otro mtodo de recoleccin de informacin es por observacin, en donde la medicin se realiza sin que la fuente de informacin se d cuenta del hecho. ORGANIZACIN DE LA INFORMACIN Luego de tomar la informacin necesaria en la investigacin que se sigue, se obtiene una gran cantidad de datos que requieren ser interpretados y sobre los cuales se busca concluir algo especfico.

La organizacin y el resumen de la informacin son dos procesos distintos que se desarrollan por separado. La organizacin hace referencia al arreglo de los datos en un formato lgico para su interpretacin. En cambio, el resumen implica la condensacin de varias mediciones en una forma compacta, ya sea grfica o numricamente. Combinacin o arreglo ordenado El slo hecho de tener ordenado un conjunto de datos en forma ascendente o descendente, permite un rpido anlisis e interpretacin de estos. Arreglo de tallo y hojas El arreglo de tallo y hojas es una tcnica que resume de manera simultnea los datos en forma numrica y presenta una ilustracin grfica de la distribucin Tabulacin de la informacin Una de las mejores tcnicas usadas en la estadstica es la elaboracin de tablas o cuadros el nmero de veces que un dato se repite de un conjunto de datos se le denomina frecuencia Un conjunto de datos puede organizarse de diferentes maneras. Una de ellas es construir una distribucin de frecuencias simple, que indica las frecuencias con que aparecen los datos Otra forma de organizar un conjunto de datos es construir una distribucin de frecuencias agrupadas, que indica las frecuencias con que aparecen los datos agrupados en lo que se denomina intervalos de clase. Cada intervalo de clase est limitado por dos valores, llamados lmites de clase (lmite inferior y lmite superior). La diferencia entre estos lmites en cada intervalo de clase se denomina ancho, tamao o amplitud del intervalo de clase. Clase es, entonces, un grupo que presenta una caracterstica comn cuantificable del conjunto de datos. El valor correspondiente al punto medio de un intervalo de clase es la marca de clase y su valor es igual a la mitad de la suma de los lmites de clase del intervalo de clase. El rango o recorrido es la diferencia entre los valores extremos de todo el conjunto de datos; en l se encuentran distribuidos todos los datos. Este nmero depende de la cantidad de datos disponibles. Una de las tcnicas usadas es la Regla de Sturges (desarrollada por H. A. Sturges en 1926). Esta regla afirma que el nmero de intervalos de clase (k), viene dado por: K= 1+3.322log n donde n es el tamao de la muestra. Si de este clculo resulta un nmero decimal, ste de redondearse al entero superior. Rango = 4.5 0.3 = 4.2 R=4.2 Numero de clases = (k)K=7 K= 1+3.322Log n =1+3.322log65 = 7.01 Amplitud de intervalos A=R/K A=4.2/8 =0.52 A=0.52 0.6 A=0.6 Nuevo rango= R*=(A)(K) R*=0.6 * 7 = 4.2 R*=4.2 Exceso = R*- R =4.2 - 4.2 = 0 Hallar el ancho o amplitud del intervalo de clase (A) = A=R/K donde R es el rango o recorrido y k es el nmero de clases

El rango es alterado y requiere, por tanto, efectuar un ajuste: R* = (A)(K) Este exceso es calculado restando el rango del nuevo rango. Exceso= R-R* Intervalos de clase. Se agrega A-1. MEDIDAS DE TENDENCIA CENTRAL

Al describir grupos de observaciones, con frecuencia es conveniente resumir la informacin con un solo nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la distribucin de datos se denomina medida o parmetro de tendencia central o de centralizacin. Entre las medidas de tendencia central tenemos:

MEDIA ARIMETICA

Calculo de la media ponderada Media aritmtica X

X = 1.5

La suma de las desviaciones respecto a la media aritmtica es igual a cero. MEDIANA Se define como el valor que divide una distribucin de datos ordenados en dos mitades, es decir, se encuentra en el centro de la distribucin. La mediana se simboliza como Me. 14 15 18 19 20 23 26 28 30 MODA Se trata del valor ms frecuente en un conjunto de datos. Se considera como el valor ms representativo o tpico de una serie de valores. Es simbolizada como Mo. Si dos valores tienen la misma frecuencia se dice que el conjunto es bimodal. Cuando ms de dos valores ocurren con la misma frecuencia y sta es la ms alta, todos los valores son modas, por lo que el conjunto de datos recibe el nombre de multimodal o polimodal. La moda tambin puede determinarse grficamente, usando un histograma de frecuencias o un polgono de frecuencias. La barra ms alta o el pico ms alto corresponde al valor que ms se repite. La moda no es tan usada como la media o la mediana. Para encontrarla se requiere que los datos estn ordenados. Su clculo es poco preciso debido a que no se puede expresar en trminos algebraicos. La media, a diferencia de la mediana y la moda, presenta una ligera estabilidad en el muestreo, es por eso que su uso es ms frecuente. La relacin de Pearson afirma que la distancia entre la media y la moda es tres veces la distancia entre la media y la mediana. Esta relacin es utilizada para calcular cualquiera de ellas, conociendo las otras dos medidas. Medida Qu Existe Toma en Se ve Requiere Ventajas y de tan siempre? cuenta cada afectada que los desventajas tendenci comn valor? por los datos estn a central es? valores ordenados? extremos? Media Es la Si Si Si No Presenta una ligera ms estabilidad frente al comn muestreo.

Mediana

De uso Si comn

No

No

Si

Moda

Usada en ocasione s

Podra no No existir o haber ms de una

No

Si

No es muy confiable para describir el conjunto de datos, pues en su clculo slo intervienen los datos ms centrales. Es ms precisa cuando los datos no estn agrupados.

La media geomtrica se utiliza para promediar crecimientos geomtricos de la variable, o cuando se quiere dar importancia a valores pequeos, o cuando se quiere determinar el valor medio para un conjunto de porcentajes. Suele utilizarse en negocios y economa para calcular las tasas de cambio promedio, las tasas de crecimiento promedio o tasas promedio. Se simboliza Mg y se define como la raz n-sima de la productoria de los n valores de la variable. La media armnica de un conjunto de datos es el recproco de la media aritmtica de los recprocos de los nmeros de la serie de datos. Se simboliza Mh y se define como. La media armnica es muy influenciable por los valores extremos de laserie, especialmente los ms pequeos. Se utiliza preferiblemente para conjuntos de datos que consisten en tasas de cambios, como la velocidad MEDIDAS DE DISPERSIN Y ESTADSTICAS BIVARIANTES 2.1 CAPITULO 4. MEDIDAS DE DISPERSIN Y ASIMETRA Se vea en el tema anterior la tendencia que tiene un conjunto de datos dado a agruparse hacia el centro, pero tambin se descubri que los datos extremos podan estar bastante alejados de esa tendencia central. Medir esa variacin respecto a los promedios es un clculo importante en el tratamiento estadstico de datos, medidas a las que se les denomina de dispersin o de variacin. RANGO O RECORRIDO Es la medida de dispersin ms fcil de calcular, slo requiere que los datos estn ordenados. Pero es poco usada como medida de dispersin porque se deja afectar fcilmente de los valores extremos de poca frecuencia. VARIANZA Y DESVIACIN ESTNDAR Es una de las medidas ms usadas en estadstica, ella a su vez da origen a otra mucho ms significativa: la desviacin tpica o estndar. Se define como la media aritmtica de los cuadrados de las desviaciones respecto a la media aritmtica. Se simboliza s2 para la varianza muestral y 2 para la varianza poblacional.

Varianza para datos agrupados = Para datos no agrupados es = /n *media2 Las unidades de la varianza son los cuadrados de las unidades de los datos: pesos cuadrados, alumnos cuadrados, etc., medidas difciles de interpretar. De all que la varianza de origen a la desviacin tpica o estndar. Desviacin tpica o estndar Esta medida se obtiene extrayendo la raz cuadrada de la varianza, tomando siempre el valor positivo. Se simboliza por s en la muestra y en la poblacin. Esta es la medida de dispersin ms conocida y ms utilizada en el anlisis de datos estadsticos

COEFICIENTE DE VARIACIN Y DESVIACIN MEDIA Las medidas de dispersin que se han estudiado son medidas absolutas y se expresan en las mismas unidades con las que se mide la variable. Cuando se comparan dos o ms conjuntos de datos con unidades de medida de observacin diferentes, no es posible compararlas con estas medidas absolutas.

Desviacin media Se define como la media aritmtica de las desviaciones respecto a la media, tomadas en valor absoluto5. Es una de las medidas ms fciles de calcular y por ello, muy usada. es = o= Cuanto mayor sea el valor de la desviacin media, mayor ser la dispersin de los datos PUNTAJE TPICO O ESTANDARIZADO Cuando se tiene una distribucin simtrica, su polgono de frecuencias revelar una forma de campana muy comn en estadstica. Esta curva es llamada curva normal, de error, de probabilidad o campana de Gauss. En ella la media aritmtica se localiza en la mitad de la distribucin. MEDIDAS ESTADSTICAS BIVARIANTES Hasta ahora se ha estudiado el anlisis de una sola variable, calculando los estadsticos de muestras que permiten describir e interpretar la distribucin de esa variable. En este captulo se estudiar el comportamiento de dos variables: distribuciones bivariantes, con el fin de determinar si existe alguna relacin entre las variables, que bien pudieran ser ambas discretas o continuas, o tambin una de ellas discreta y la otra continua.. REGRESIN Y CORRELACIN En muchos casos se requiere conocer ms que el comportamiento de una sola variable, se requiere conocer la relacin entre dos o ms variables como la relacin entre produccin y consumo; salarios y horas de trabajo; oferta y La palabra regresin la utilizamos para significar la estimacin de una variable en funcin de otro valor conocido, correspondiente a la otra variable. REGRESIN LINEAL SIMPLE La regresin examina la relacin entre dos variables restringiendo una de ellas respecto a la otra, con el objeto de estudiar las variaciones de la primera cuando la otra permanece constante. CORRELACIN La correlacin entre dos variables busca determinar el grado de relacin que existe entre ellas dos. Ella se calcula con los coeficientes de correlacin. Los coeficientes de correlacin son nmeros que varan entre +1 y -1. Su magnitud indica el grado de asociacin entre las variables, si es 0 indica que no existe relacin alguna y los valores extremos +1 y -1 indican una correlacin perfecta positiva o negativa respectivamente. NMEROS INDICE Los nmeros ndice son cifras relativas expresadas en trminos porcentuales, que sirven para indicar las variaciones que sufre una serie de valores respecto a una de ellas, tomada como punto de referencia y a la cual se le denomina base CONSTRUCCIN DE NMEROS NDICE Para calcular un nmero ndice se toma un valor de la serie como base y se establece un cociente entre el valor de la variable a estudiar y el valor de la variable base. TIPOS DE NMEROS NDICES El ndice de mayor aplicacin es el ndice de precios, que mide los cambios de precios en uno o ms artculos en un perodo determinado respecto a un perodo base NDICES SIMPLES Se construyen para una sola observacin y su base puede ser fija o variable. Cuando se trata de medir la variacin de un fenmeno observado a travs de una serie de perodos, los ndices simples son los ms adecuados

Potrebbero piacerti anche