Sei sulla pagina 1di 71

INTRODUCCIN

La estadstica es un potente auxiliar de muchas ciencias y actividades humanas: sociologa, sicologa, geografa humana, economa, es una herramienta indispensable para la toma de decisiones. Tambin es ampliamente empleada para mostrar los aspectos cuantitativos de una situacin. La estadstica est relacionada con el estudio de proceso cuyo resultado es ms o menos imprescindible y con la finalidad de obtener conclusiones para tomar decisiones razonables de acuerdo con tales observaciones.

El resultado de estudio de dichos procesos, denominados procesos aleatorios, puede ser de naturaleza cualitativa o cuantitativa y, en este ltimo caso, discreta o contina. Son muchas las predicciones de tipo socilogo, o econmico, que pueden hacerse a partir de la aplicacin exclusiva de razonamientos probabilsticos a conjuntos de datos objetivos como son, por ejemplo, los de naturaleza demogrfica.

Las predicciones estadsticas, difcilmente hacen referencia a sucesos concretos, pero describen con considerable precisin en el comportamiento global de grandes conjuntos de sucesos particulares. Son predicciones que, en general, no acostumbran resultar tiles.

Para saber quien, de entre los miembros de una poblacin importante, va a encontrar trabajo o a quedarse sin l; o en cuales miembros va a verse aumentada o disminuida una familia concreto en los prximos meses. Pero que, en cambio puede proporcionar estimaciones fiables del prximo aumento o disminucin de la taza de desempleo referido al conjunto de la poblacin; o de la posible variacin de os ndices de natalidad o mortalidad.

Evolucin Histrica De La Estadstica El trmino estadstica es ampliamente escuchado y pronunciado a diario desde diversos sectores activos de la sociedad. Sin embargo hay una gran diferencia entre el sentido del trmino cuando se utiliza en el lenguaje corrientemente (generalmente al anteceder una citacin de carcter numrico) y lo que la estadstica significa como ciencia. Son diversos los vocablos que se citan como antecedentes del trmino estadstica, Sin pretender ser exhaustivos, pero si buscando resear los de mayor mencin, podemos nombrar los siguientes:
o o

Status (latn), que significa situacin, posicin, estado. Statera (griego), que quiere decir balanza, ya que la estadstica mide o pesa hechos.

Staat (alemn), que se refiere a Estado como expresin de unidad poltica superior.

La razn o razones que motivaron al hombre en un momento de su desarrollo a tomar en cuenta datos con propsitos estadsticos, tal vez la hallemos si tenemos en cuenta que es difcil imaginar un organismo social, sea cual fuere la poca, sin la necesidad, casi instintiva, de recoger aquellas hechos que aparecen como actos esenciales de la vida; y as, al situarnos en una etapa del desarrollo de la estadstica podemos pensar que se convirti en una aritmtica estatal para asistir al gobernante que necesitaba conocer la riqueza y el nmero de los sbditos con el objeto de recaudar impuestos o presupuestar la guerra

Desde los comienzos de la civilizacin han existido formas sencillas de estadstica, pues ya se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmero de personas, animales o ciertas cosas. Segn Federico Engels en su obra 'El papel del trabajo en la transformacin del mono en hombre"; el dominio de la humanidad de la utilizacin del fuego, transformo al hombre de errante (cazador o recolector) en sedentario, lo que pronto lo oblig a delimitar su coto de caza y lo transformo en la "propiedad privada" Como consecuencia de esto apareci inmediatamente la

necesidad imperiosa de saber cual era la riqueza que se posea (contar); surgieron entonces las matemticas y las estadsticas.

Hacia el ao 3000 a.C. los babilonios usaban ya pequeas tablillas de arcilla para recopilar datos tabulados sobre la produccin agrcola y de los gneros vendidos o cambiados mediante trueques. Los egipcios analizaban los datos de la poblacin y la renta del pas mucho antes de construir las pirmides en el siglo XXXI a.C. As por ejemplo, en los monumentos egipcios hay testimonios de que los movimientos de poblaciones eran seguidos por medio de censos.

Los libros bblicos de Nmeros y Crnicas incluyen, en algunas partes, trabajos de estadstica. El primero cita que Moiss hizo un censo de los israelitas en el desierto y el segundo, ordenado por David describe el bienestar material de las diversas tribus judas. En China, Confuco narra como el emperador Yao hizo levantar un recuento agrcola, industrial y comercial del pas en el ao 2238 a.C. Los griegos realizaban censos cuya informacin se utilizaba para cobrar impuestos hacia el ao 594 a.C. El Imperio Romano fue el primer gobierno que recopil una gran cantidad de datos sobre la poblacin, superficie y renta de todos los territorios bajo su control. Especial mencin ameritan los estudios Renta Vitalicia, durante la poca de Csar Augusto, se decret que todos los sbditos tenan que tributar y por tanto exigi a todas las personas que se presentaran al estadstico ms cercano que era entonces el recaudador de impuestos. Los romanos estudiaron tambin el clculo de la vida media a distintas edades y los documentos sobre los itinerarios en los que se describen las distancias entre las diversas localidades y el desarrollo de las vas de comunicacin.

Durante la edad media slo se realizaron algunos censos exhaustivos en Europa. Los reyes visigodos ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los aos 758 y 762 respectivamente. Despus de la conquista normanda de Inglaterra en 1066, el rey Guillermo 1 de Inglaterra encarg un censo. La informacin obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book. En 1662 apareci el primer estudio

estadstico notable de poblacin, titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas de defuncin en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrnomo ingls Edmund Halley como base para la primera tabla de mortalidad.

Resea Histrica De La Estadstica Desde los comienzos de la civilizacin han existido formas sencillas de estadsticas, pues ya se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmero de personas, animales o ciertas cosas. Hacia el ao 3000 A.C. los babilonios usaban ya pequeas tablillas de arcilla para recopilar datos en tablas sobre la produccin agrcola y de los gneros vendidos o cambiados mediante trueque.

Los egipcios analizaban los datos de la poblacin y la renta del pas mucho antes de construir las pirmides en el siglo XXXI a.C. Los libros bblicos de Nmeros y Crnicas incluyen, en algunas partes, trabajos de estadstica. El primero contiene dos censos de la poblacin de Israel y el segundo describe el bienestar material de las diversas tribus judas. En China existan registros numricos similares con anterioridad al ao 2000 A.C. Los griegos clsicos realizaban censos cuya informacin se utilizaba hacia el ao 594 A.C. para cobrar impuestos.

El Imperio romano fue el primer gobierno que recopil una gran cantidad de datos sobre la poblacin, superficie y renta de todos los territorios bajo su control. Durante la edad media slo se realizaron algunos censos exhaustivos en Europa. Los reyes carolingios Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los aos 758 y 762 respectivamente. Despus de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encarg un censo. La informacin obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book. El registro de nacimientos y defunciones comenz en Inglaterra a principios del siglo XVI, y en

1662 apareci el primer estudio estadstico notable de poblacin, titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas de defuncin en Londres).

Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrnomo ingls Edmund Halley como base para la primera tabla de mortalidad. En el siglo XIX, con la generalizacin del mtodo cientfico para estudiar todos los fenmenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la informacin a valores numricos para evitar la ambigedad de las descripciones verbales.

En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con exactitud los valores de los datos econmicos, polticos, sociales, psicolgicos, biolgicos y fsicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre todo el proceso de interpretacin de esa informacin. El desarrollo de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones

probabilsticas; los resultados de stas se pueden utilizar para analizar datos estadsticos. La probabilidad es til para comprobar la fiabilidad de las inferencias estadsticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadstico

Etimologa de la Palabra Estadstica La palabra "estadstica" procede del latn statisticum collegium ("consejo de Estado") y de su derivado italiano statista ("hombre de Estado" o "poltico"). El trmino alemn Statistik, que fue primeramente introducido por Gottfried Achenwall (1749), designaba originalmente el anlisis de datos del Estado, es decir, "la ciencia del Estado" (tambin llamada "aritmtica poltica" de su traduccin directa del ingls). No fue hasta el siglo XIX cuando el trmino

estadstica adquiri el significado de recolectar y clasificar datos. Este concepto fue introducido por el ingls John Sinclair.

En su origen, por tanto, la estadstica estuvo asociada a datos a ser utilizados por el gobierno y cuerpos administrativos (a menudo centralizados). La coleccin de datos acerca de estados y localidades contina ampliamente a travs de los servicios de estadstica nacionales e internacionales. En particular, los censos suministran informacin regular acerca de la poblacin.

Universo En estadstica es el nombre especifico que recibe particularmente en la investigacin social la operacin dentro de la delimitacin del campo de investigacin que tienen por objeto la determinacin del conjunto de unidades de observaciones del conjunto de unidades de observacin que van a ser investigadas. Para muchos investigadores l termino universo y poblacin son sinnima. En general, el universo es la totalidad de elementos o caractersticas que conforman el mbito de un estudio o investigacin. Est formado por la totalidad de los elementos que se desean estudiar, ejemplos podran ser: La poblacin total de Venezuela, los alumnos cursantes en las universidades del pas, la produccin de toda una industria, a cosecha de un ao dado, el rendimiento de una raza de ganado, entre otros.

Poblacin El concepto de poblacin en estadstica va ms all de lo que comnmente se conoce como tal. Una poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan caractersticas comunes. Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones. Ejemplo: Los miembros del Colegio de Ingenieros del Estado Cojedes. El tamao que tiene una poblacin es un factor de suma importancia en el proceso de investigacin estadstica, y este tamao vienen dado por el nmero de elementos que constituyen la poblacin, segn el nmero de elementos la poblacin puede ser finita o infinita.

Cuando el nmero de elementos que integra la poblacin es muy grande, se puede considerar a esta como una poblacin infinita, por ejemplo; el conjunto de todos los nmeros positivos. Una poblacin finita es aquella que est formada por un limitado nmero de elementos, por ejemplo; el nmero de estudiante del Ncleo San Carlos de la Universidad Nacional Experimental Simn Rodrguez.

Muestra Se llama muestra a una parte de la poblacin a estudiar que sirve para representarla. Una muestra es una coleccin de algunos elementos de la poblacin, pero no de todos. Finalmente una muestra debe ser definida en base de la poblacin determinada, y las conclusiones que se obtengan de dicha muestra solo podrn referirse a la poblacin en referencia. Ejemplo; El estudio realizado a 50 miembros del Colegio de Ingenieros del Estado Cojedes. Una muestra representativa contiene las caractersticas relevantes de la poblacin en las mismas proporciones que estn incluidas en tal poblacin.

Censo Se entiende por censo aquella numeracin que se efecta a todos y cada uno de los caracteres componentes de una poblacin. Para Levin & Rubin (1996) "Algunas veces es posible y prctico examinar a cada persona o elemento de la poblacin que deseamos describir. A esto lo llamamos una numeracin completa o censo. Utilizamos el muestre cuando no es posible contar o medir todos los elementos de la poblacin. Si es posible listar (o enumerar) y observar cada elemento de la poblacin, los censos se utilizan rara vez porque a menudo su compilacin es bastante difcil, consume mucho tiempo por lo que resulta demasiado costoso.

Encuesta Se entiende por encuesta las observaciones realizadas por muestreo, es decir son observaciones parciales. El diseo de encuestas es exclusivo de las ciencias sociales y parte de la premisa de que si queremos conocer algo sobre el comportamiento de las personas, lo mejor, ms directo y simple es preguntrselo

directamente a ellas. (Cadenas, 1974). Segn Antonio Napolitano "La encuesta, es un mtodo mediante el cual se quiere averiguar. Se efecta a travs de cuestionarios verbales o escritos que son aplicados a un gran nmero de personas".

Datos Estadsticos Los datos estadsticos no son otra cosa que el producto de las observaciones efectuadas en las personas y objetos en los cuales se produce el fenmeno que queremos estudiar. Dicho en otras palabras, son los antecedentes (en cifras) necesarios para llegar al conocimiento de un hecho o para reducir las consecuencias de este. Los datos estadsticos se pueden encontrar de forma no ordenada, por lo que es muy difcil en general, obtener conclusiones de los datos presentados de esta manera.

Para poder obtener una precisa y rpida informacin con propsitos de descripcin o anlisis, estos deben organizarse de una manera sistemtica; es decir, se requiere que los datos sean clasificados. Esta clasificacin u organizacin puede muy bien hacerse antes de la recopilacin de los datos. Ejemplo: Si se quiere conocer las caractersticas de los estudiantes del Ncleo San Carlos de la UNESR, que solicitan prstamo a la biblioteca de dicha Universidad, la recoleccin de la informacin debe clasificar a cada estudiante sobre la base de: Carrera que estudia, edad, semestre de estudios, etc. Vemos pues que la clasificacin marca la pauta de la clase de datos que debe ser obtenido

Serie Estadstica Una masa de datos que deben ser organizados para disponerlos en un orden, arreglo o secuencia lgica, con el fin de facilitar el anlisis de los mismos esta coleccin de datos numricos obtenidos de la observacin, que se clasifican y ordenan segn un determinado criterio, se denominan "series estadsticas", tambin conocidas como "distribucin estadstica".

Series de Frecuencia Cuando realizamos un estudio de cada uno de los elementos que componen la poblacin o muestra bajo anlisis, observamos que en general, hay un nmero de veces en que aparece repetido un mismo valor de una variable, o bien repeticiones de la misma modalidad de un atributo. Este nmero de repeticiones de un resultado, recibe el nombre de frecuencia absoluta o simplemente frecuencia. El procedimiento mediante el cual se realiza el conteo, para as determinar el nmero de veces que cada dato se repite, recibe el nombre de tabulacin.

Ejemplo: Consideremos las edades de 20 nios, pertenecientes al Preescolar Blanca de Prez, ubicado en la urbanizacin Monseor Padilla

5 6 3 4

6 3 4 3

5 4 6 6

4 5 5 4

3 4 3 6

Tabulando los datos tenemos

Nios distribuidos por edades: Edad (variable) 3 4 5 6 Total = N de nios (Frecuencia) 5 6 4 5 20

Al agrupar los resultados de las observaciones en trmino de las veces que stos se repiten, da lugar a las llamadas "series de frecuencias" o distribuciones de frecuencias; las cuales se dividen a su vez en series de frecuencia cualitativas y cuantitativas, segn que los caracteres de estudio se refieran a atributos o variables respectivamente.

Series De Frecuencia Acumulativa Son comnmente llamadas series de frecuencia de atributos o caracteres cualitativos y las formas de representar un atributo recibe el nombre de modalidades. Cuando se observan y se obtienen los elementos que deseamos estudiar con respecto a un carcter de tipo cualitativo y se procede a agruparlos segn las distintas modalidades que toma el atributo, "frecuencia cualitativa".

Ejemplo: Agrupamos los resultados obtenidos al observar los 35 estudiantes de la materia estadstica I, respecto a su estado civil.

Estudiantes de la materia Estadsticas I, clasificados por su estado civil.

Estado civil Solteros Casados Viudos Divorciados

N de Estudiantes (frecuencia) 18 12 1 4

Series De Frecuencias Cualitativas Es el resultado del agrupamiento de los valores que se repiten (frecuencia) al ser observada una variable.

10

Ejemplo: Tomamos nuevamente los 35 estudiantes de la materia estadstica I, respecto a su edad.

Edad (en aos) 19 20 25 28 32 42 Total =

N de estudiantes (frecuencia) 12 2 8 6 4 3 35

Intervalos De Clase Rango utilizado para dividir el conjunto de posibles valores numricos al trabajar con grandes cantidades de datos. Por ejemplo, si los valores estn entre 1 y 100, se podrn definir grupos por medio de los intervalos 1-25, 26-50, 51-75, 76-100 cuando el intervalo de la clase es 25 Estatura en pulgadas Nmero de estudiantes 60-62 63-65 66-68 69-71 72-74 Total 5 18 42 27 8 100

Distribuciones de frecuencia

11

La primera clase (o categora), por ejemplo, comprende las estaturas entre 60 y 62 pulgadas y se indica con el rango 60-62. Como hay 5 estudiantes en esta clase, la correspondiente frecuencia de clase es 5. A los datos organizados y reunidos en clases, como la anterior distribucin de frecuencias, se les llama datos agrupados. Aunque el proceso de agrupamiento generalmente quita detalles originales en los datos, es muy ventajosa pues proporciona una visin muy amplia y clara, adems de que se obtienen relaciones evidentes.

El smbolo que define a una clase, como 60-62 de la tabla anterior, se llama intervalo de clase. A los nmeros 60 y 62 se les conoce como lmites de clase; el nmero ms pequeo (60) es el lmite inferior de clase, mientras que el ms grande (62) es el lmite superior de clase. A un intervalo de clase que, por lo menos tericamente, no tiene lmite de clase inferior o superior se le llama Intervalo de Clase Abierto. Por ejemplo, en grupos de edades de individuos, el intervalo de clase 65 aos o ms es un Intervalo de Clase Abierto.

Intervalo Total Los valores menores que la frontera de clase superior de un intervalo de clase dado

Elementos Finitos e Infinitos Estos elementos finitos son aquellos nmeros o muestras en donde se pueden cuantificar numricamente, los infinitos como su nombre lo indica son bastantes en donde estos se pierden en el infinito numrico.

Variables En un estudio cientfico, podemos clasificar las variables segn la escala de medicin o la influencia que asignemos a unas variables sobre otras y por esta razn.

12

Segn La Escala De Medicin: VARIABLES CUALITATIVAS: Son las variables que expresan distintas cualidades, caractersticas o modalidad. Cada modalidad que se presenta se denomina atributo o categora y la medicin consiste en una clasificacin de dichos atributos. Las variables cualitativas pueden ser ordinales y nominales. Las variables cualitativas pueden ser dicotmicas cuando slo pueden tomar dos valores posibles como s y no, hombre y mujer o son politmicas cuando pueden adquirir tres o ms valores. Dentro de ellas podemos distinguir: 1)Variable Cualitativa Ordinal: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo, leve, moderado, grave. 2) Variable Cualitativa Nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores o el lugar de residencia.

VARIABLES CUANTITATIVAS: Son las variables que se expresan mediante cantidades numricas. Las variables cuantitativas adems pueden ser: 1) Variable Discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores especficos que la variable pueda asumir. Un ejemplo es el nmero de hijos.

Categoras de la variable

Frecuencia Frecuencia Absoluta Relativa

Frecuencia Absoluta Acumulada

Frecuencia Relativa Acumulada

...

...

...

...

...

...

...

...

...

...

13

En las variables cuantitativas discretas la distribucin de frecuencias (Absolutas o Relativas) puede representarse mediante un grfico de varillas, que no es sino una especie de grfico de barras donde las barras se representan como una lnea gruesa (una especie de varilla).

El grfico para frecuencias acumuladas (Absolutas o Relativas) de variables discretas se construye de manera que slo aparece la lnea de lo que sera el borde superior del rectngulo de un grfico de barras

14

2) Variable Continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo el peso o la altura, que solamente limitado por la precisin del aparato medidor, en teora permiten que siempre existe un valor entre dos cualesquiera.

Intervalo

Categoras Frecuencia Frecuencia de la Absoluta Relativa variable

Frecuencia Absoluta Acumulada

Frecuencia Relativa Acumulada

...

...

...

...

...

...

...

...

...

...

...

...

La marca de clase queda fijada por lmite inferior del intervalo y

donde

es el

es el lmite superior del intervalo. Llamaremos

amplitud del intervalo a la cantidad de unidades del recorrido de la variable que contiene un intervalo. Segn la influencia que asignemos a unas variables sobre otras, podrn ser: Variables Independientes: Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando intrnsecamente a los casos del mismo. Un tipo especial son las variables de confusin, que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo.

15

Variables Dependientes: Son las variables de respuesta que se observan en el estudio y que podran estar influenciadas por los valores de las variables independientes.

Estadstica La estadstica es comnmente considerada como una coleccin de hechos numricos expresados en trminos de una relacin sumisa, y que han sido recopilados a partir de otros datos numricos. El arte y la ciencia de la estadstica incluyen procedimiento para identificar una poblacin, seleccionar una muestra, reconocer los elementos o bien las unidades de observacin de ella y decidir qu mediciones pueden hacerse y los tratamientos (Si existen) aplicables, llevando a cabo y registrando las mediciones y las interpretaciones correctas de los datos resultantes, de tal forma que sea posible ilustrar una decisin basada en ellos". D.,H. Chritensen. (1999) La estadstica es una tcnica especial apta para el estudio cuantitativo de los fenmenos de masa o colectivo, cuya mediacin requiere una masa de observaciones de otros fenmenos ms simples llamados individuales o particulares. D.H.Besterfield (2000) La estadstica es una ciencia que comprende la recopilacin, tabulacin, anlisis e interpretacin de los datos cuantitativos y cualitativos". KennedyNeville (2000)

Finalmente a manera de conceptualizacin propia se puede definir como un conjunto de datos cuantitativos sobre un tema o grupo determinados, en especial cuando los datos se renen y agrupan de manera sistemtica.

16

La Estadstica Descriptiva Es una parte de la estadstica que se dedica a analizar y representar los datos. Este anlisis es muy bsico, pero fundamental en todo estudio. Aunque hay tendencia a generalizar a toda la poblacin las primeras conclusiones obtenidas tras un anlisis descriptivo, su poder inferencial es mnimo y debera evitarse tal proceder. Otras ramas de la estadstica se centran en el contraste de hiptesis y su generalizacin a la poblacin.

Se refiere a la recoleccin, presentacin, descripcin, anlisis e interpretacin de una coleccin de datos, esencialmente consiste en resumir stos con uno o dos elementos de informacin (medidas descriptivas) que caracterizan la totalidad de los mismos. La estadstica Descriptiva es el mtodo de obtener de un conjunto de datos conclusiones sobre si mismos y no sobrepasan el conocimiento proporcionado por stos. Puede utilizarse para resumir o describir cualquier conjunto ya sea que se trate de una poblacin o de una muestra, cuando en la etapa preliminar de la Inferencia Estadstica se conocen los elementos de una muestra.

La Estadstica Inductiva O Inferencial Estadstica Inferencial se refiere al proceso de lograr generalizaciones acerca de las propiedades del todo, poblacin, partiendo de lo especfico, muestra. Las cuales llevan implcitos una serie de riesgos. Para que stas generalizaciones sean vlidas la muestra deben ser representativa de la poblacin y la calidad de la informacin debe ser controlada, adems puesto que las conclusiones as extradas estn sujetas a errores, se tendr que especificar el riesgo o probabilidad que con que se pueden cometer esos errores. La estadstica inferencial es el conjunto de tcnicas que se utiliza para obtener conclusiones que sobrepasan los lmites del conocimiento aportado por los datos, busca obtener informacin de un colectivo mediante un metdico procedimiento del manejo de datos de la muestra. Algunas de las tcnicas empleadas en este primer anlisis de los datos se enumeran ms abajo en el listado de conceptos bsicos. Bsicamente, se lleva a cabo un estudio

17

calculando una serie de medidas de tendencia central, para ver en qu medida los datos se agrupan o dispersan en torno a un valor central.

Importancia De La Estadstica La Estadstica se ocupa de la recoleccin, agrupacin, presentacin, anlisis e interpretacin de datos. A menudo se llaman estadsticas a las listas de estos datos, cosa que crea una cierta ambigedad, que no debera originarnos confusiones. La Estadstica no son slo los resultados de encuestas, ni el clculo de unos porcentajes, la Estadstica es un mtodo cientfico que pretende sacar conclusiones a partir de unas observaciones hechas.

La estadstica trata, en primer lugar, de acumular la masa de datos numricos provenientes de la observacin de multitud de fenmenos, procesndolos de forma razonable. Mediante la teora de la probabilidad analiza y explora la estructura matemtica subyacente al fenmeno del que estos datos provienen y, mediante el conocimiento de tal estructura, trata de sacar conclusiones y predicciones que ayuden al mejor aprovechamiento del fenmeno para los fines que de l se pueden pretender.

Recoleccin, Organizacin, Presentacin Y Anlisis De Datos La Recoleccin De Datos se refiere al uso de una gran diversidad de tcnicas y herramientas que pueden ser utilizadas por el analista para desarrollar los sistemas de informacin, los cuales pueden ser la entrevistas, la encuesta, el cuestionario, la observacin, el diagrama de flujo y el diccionario de datos. Todas estos instrumentos se aplicar en un momento en particular, con la finalidad de buscar informacin que ser til a una investigacin en comn.

Clasificacin De Los Datos:

Los datos estadsticos pueden ser

clasificados en cualitativos, cuantitativos, cronolgicos y geogrficos. Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de clase y no de cantidad. Ejemplo: Si deseamos clasificar los estudiantes que cursan la materia de estadstica I por su estado civil, observamos que pueden existir

18

solteros, casados, divorciados, viudos. Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes, decimos que son datos cuantitativos. Ejemplo: Se clasifican los estudiantes del Ncleo San Carlos de la UNESR de acuerdo a sus notas, observamos que los valores (nota) representan diferentes magnitudes. Datos cronolgicos: cuando los valores de los datos varan en diferentes instantes o perodos de tiempo, los datos son reconocidos como cronolgicos. Ejemplo: Al registrar los promedios de notas de los Alumnos del Ncleo San Carlos de la UNESR en los diferentes semestres. Datos geogrficos: cuando los datos estn referidos a una localidad geogrfica se dicen que son datos geogrficos. Ejemplo El nmero de estudiantes de educacin superior en las distintas regiones del pas.

Fuentes de datos Estadsticos: Los datos estadsticos necesarios para la comprensin de los hechos pueden obtenerse a travs de fuentes primarias y fuentes secundarias. Fuentes de datos primarias: es la persona o institucin que ha recolectado directamente los datos. Fuentes secundarias: son las publicaciones y trabajos hechos por personas o entidades que no han recolectado directamente la informacin.

Las fuentes primarias ms confiables, son las efectuadas por oficinas gubernamentales encargadas de tal fin. En la prctica, es aconsejable utilizar fuentes de datos primarias y en ltima instancia cuando estas no existan, usar estadsticas de fuentes secundarias. Con este ltimo tipo no debemos pasar por alto que la calidad de las conclusiones estadsticas depende en grado sumo de la exactitud de los datos que se recaben. De anda servira usar tcnicas estadsticas precisas y refinadas para llegar a conclusiones valederas, si estas tcnicas no son aplicadas a datos adecuados o confiables. Ejemplo: Si un investigador quiere conocer el nmero de alumnos repitientes en educacin media, clasificados por ciclos, para los ltimos diez aos, el investigador puede usar una fuente primaria, tal como la memoria y cuenta el Ministerio de Educacin cada ao.

19

Tcnicas Para Hallar Datos Los analistas utilizan una variedad de mtodos a fin de recopilar los datos sobre una situacin existente, como entrevistas, cuestionarios, inspeccin de registros (revisin en el sitio) y observacin. Cada uno tiene ventajas y desventajas. Generalmente, se utilizan dos o tres para complementar el trabajo de cada una y ayudar a asegurar una investigacin completa.

La Entrevista Las entrevistas se utilizan para recabar informacin en forma verbal, a travs de preguntas que propone el analista. Quienes responden pueden ser gerentes o empleados, los cuales son usuarios actuales del sistema existente, usuarios potenciales del sistema propuesto o aquellos que proporcionarn datos o sern afectados por la aplicacin propuesta. El analista puede entrevistar al personal en forma individual o en grupos algunos analistas prefieren este mtodo a las otras tcnicas que se estudiarn ms adelante. Sin embargo, las entrevistas no siempre son la mejor fuente de datos de aplicacin. Dentro de una organizacin, la entrevistas es la tcnica ms significativa y productiva de que dispone el analista para recabar datos. En otras palabras, la entrevista es un intercambio de informacin que se efecta cara a cara. Es un canal de comunicacin entre el analista y la organizacin; sirve para obtener informacin acerca de las necesidades y la manera de satisfacerlas, as como concejo y comprensin por parte del usuario para toda idea o mtodo nuevos. Por otra parte, la entrevista ofrece al analista una excelente oportunidad para establecer una corriente de simpata con el personal usuario, lo cual es fundamental en transcurso del estudio.

Preparacin de la Entrevista 1. Determinar la posicin que ocupa de la organizacin el futuro entrevistado, sus responsabilidades bsicas, actividades, etc. (Investigacin). 2. Preparar las preguntas que van a plantearse, y los documentos necesarios (Organizacin). 3. Fijar un lmite de tiempo y preparar la agenda para la entrevista. (Sicologa).

20

4. Elegir un lugar donde se puede conducir la entrevista con la mayor comodidad (Sicologa). 5. Hacer la cita con la debida anticipacin (Planeacin).

Recabar Datos Mediante La Entrevista La entrevista es una forma de conversacin, no de interrogacin, al analizar las caractersticas de los sistemas con personal seleccionado cuidadosamente por sus conocimientos sobre el sistema, los analistas pueden conocer datos que no estn disponibles en ningn otra forma.

En las investigaciones de sistema, las formas cualitativas y cuantitativas de la informacin importantes. La informacin cualitativa est relacionada con opinin, poltica y descripciones narrativas de actividades o problemas, mientras que las descripciones cuantitativas tratan con nmeros frecuencia, o cantidades. A menudo las entrevistas pueden ser la mejor fuente de informacin cualitativas, los otros mtodos tiende a ser ms tiles en la recabacin de datos cuantitativos.

Son valiosas las opiniones, comentarios, ideas o sugerencia en relacin a como se podra hacer el trabajo; las entrevistas a veces es la mejor forma para conocer las actividades de las empresas. La entrevista pueden descubrir rpidamente malos entendidos, falsa expectativa o incluso resistencia potencial para las aplicaciones de desarrollo; ms an, a menudo es ms fcil calendarizar una entrevista con los gerentes de alto nivel, que pedirle que llenen cuestionario.

Determinacin Del Tipo De Entrevista La estructura de la entrevista vara. Si el objetivo de la entrevista radica en adquirir informacin general, es conveniente elaborar una serie de pregunta sin estructura, con una sesin de preguntas y respuesta libres estructuradas utilizan pregunta estandarizada. Las entrevistas

El formato de respuestas para las preguntas pueden ser abierto o cerrado; las preguntas para respuestas abierta permiten a los entrevistados dar cualquier

21

respuesta que parezca apropiado. Pueden contestar por completo con sus propias palabras. Con las preguntas para respuesta cerradas se proporcionan al usuario un conjunto de respuesta que se pueda seleccionar. Todas las personas que respondes se basan en un mismo conjunto de posible respuestas.

Ejemplos de las preguntas abiertas y cerradas en la entrevista estructurada Forma De Pregunta Abierta Forma De Pregunta Cerrada

Ejemplo: obtener la informacin sobre Ejemplo: obtener la informacin sobre las caractersticas de diseos crticas las para los empleados. Caractersticas de diseo crticas para

" algunos empleados han sugerido que la los empleados. mejor forma para hacer eficiente el " La experiencia le ha proporcionado procesamiento de pedidos es instalar un una amplia visin en cuanto a la forma sistema de computadora que maneje en la que la empresa maneja los todos los clculos..." pedidos..." Me gustara que usted

Bajo estas circunstancias apoyara contestara algunas preguntas especficas usted el desarrollo de un sistema de este en relacin en lo anterior: tipo?. -Qu etapas trabajas bien?cules no -En donde se presenta la mayor parte del problema? - Cundo ocurre un atraso, cmo se maneja? Entre otros

Encuesta Hoy en da la palabra "encuesta" se usa ms frecuentemente para describir un mtodo de obtener informacin de una muestra de individuos. Esta "muestra" es usualmente slo una fraccin de la poblacin bajo estudio. Por ejemplo, antes de una eleccin, una muestra de electores es interrogada para determinar cmo los candidatos y los asuntos son percibidos por el pblico un fabricante hace una encuesta al mercado potencial antes de introducir un nuevo producto una

22

entidad del gobierno comisiona una encuesta para obtener informacin para evaluar legislacin existente o para preparar y proponer nueva legislacin. No tan slo las encuestas tienen una gran variedad de propsitos, sino que tambin pueden conducirse de muchas maneras, incluyendo por telfono, por correo o en persona. An as, todas las encuestas tienen algunas caractersticas en comn. Una "encuesta" recoge informacin de una "muestra." Una "muestra" es usualmente slo una porcin de la poblacin bajo estudio. El tamao de muestra requerido en una encuesta depende en parte de la calidad estadstica necesaria para los establecer los hallazgos; esto a su vez, est relacionado en cmo esos hallazgos sern usados.

An as, no hay una regla simple para el tamao de muestra que pueda ser usada en todas las encuestas. Mucho de esto depende de los recursos profesionales y fiscales disponibles. Los analistas frecuentemente encuentran que una muestra de tamao moderado es suficiente estadstica y operacionalmente. Por ejemplo, las muy conocidas encuestas nacionales frecuentemente usan cerca de 1,000 personas para obtener informacin razonable sobre actitudes y opiniones nacionales.

Cuestionario Los cuestionarios proporcionan una alternativa muy til para la entrevista; si embargo, existen ciertas caractersticas que pueden ser apropiada en algunas situaciones e inapropiadas en otra. Al igual que la entrevistas, deben disearse cuidadosamente para una mxima efectividad.

Recabacin De Datos Mediante Cuestionarios Para los analistas los cuestionarios pueden ser la nica forma posible de relacionarse con un gran nmero de personas para conocer varios aspectos del sistema. Cuando se llevan a cabo largos estudios en varios departamento, se puede distribuir los cuestionarios a todas las personas apropiadas para recabar hechos en relacin al sistema. En mayor parte de los casos, el analista no ver a los que responde; no obstante, tambin esto es una ventaja porque aplican muchas

23

entrevista ayuda a asegurar que el interpelado cuenta con mayor anonimato y puedan darse respuestas mas honesta ( y menos respuestas prehechas o estereotipadas). Tambin las preguntas estandarizadas pueden proporcionar datos ms confiable.

Cuestionario Abierto Al igual que las entrevistas, los cuestionarios pueden ser abiertos y se aplican cuando se quieren conocer los sentimientos, opiniones y experiencias generales; tambin son tiles al explorar el problema bsico, por ejemplo, un analista que utiliza cuestionarios para estudiar los mtodos de verificacin de crdito, es un medio. El formato abierto proporciona una amplia oportunidad para quienes respondan escriba las razones de sus ideas. Algunas personas sin embargo, encuentran ms fcil escoger una de un conjunto de respuestas preparadas que pensar por s mismas.

Cuestionario Cerrado El cuestionario cerrado limita las respuestas posibles del interrogado. Por medio de un cuidadoso estilo en la pregunta, el analista puede controlar el marco de referencia. Este formato es el mtodo para obtener informacin sobre los hechos. Tambin fuerza a los individuos para que tomen una posicin y forma su opinin sobre los aspectos importantes.

La Observacin Otra tcnica til para el analista en su progreso de investigacin, consiste en observar a las personas cuando efectan su trabajo. Como tcnica de investigacin, la observacin tiene amplia aceptacin cientfica. Los socilogos, siclogos e ingenieros industriales utilizan extensamente sta tcnica con el fin de estudiar a las personas en sus actividades de grupo y como miembros de la organizacin.

24

Tipos de Observacin Primero, puede observar a una persona o actitud sin que el observado se d cuenta y su interaccin por aparte del propio analista. Quiz esta alternativa tenga poca importancia para el anlisis de sistemas, puesto que resulta casi imposible reunir las condiciones necesarias. Segundo, observar una operacin sin intervenir para nada, pero estando la persona observada enteramente consciente de la observacin. Por ltimo, puede observar y a la vez estar en contacto con las personas observas. La interaccin puede consistir simplemente en preguntar respecto a una tarea especfica, pedir una explicacin, etc.

Diagrama de Flujo Es una representacin pictrica de los pasos en proceso. til para determinar cmo funciona realmente el proceso para producir un resultado. El resultado puede ser un producto, un servicio, informacin o una combinacin de los tres. Al examinar cmo los diferentes pasos es un proceso se relacionan entre s, se puede descubrir con frecuencia las fuentes de problemas potenciales. Los diagramas de flujo se pueden aplicar a cualquier aspecto del proceso desde el flujo de materiales hasta los pasos para hacer la venta u ofrecer un producto. Con frecuencia este nivel de detalle no es necesario, pero cuando se necesita, el equipo completo de trabajo ms pequeos pueden agregar niveles segn sea necesario durante el proyecto.

Presentacin de datos La presentacin de datos estadsticos constituye en sus diferentes modalidades uno de los aspectos de mas uso en la estadstica descriptiva. A partir podemos visualizar a travs de los diferentes medios escritos y televisivos de comunicacin masiva la presentacin de los datos estadsticos sobre el comportamiento de las principales variables econmicas y sociales, nacionales e internacionales. Existen tres formas diferentes de presentar los datos estadsticos, que son:

25

1-Presentacin Escrita: Esta forma de presentacin de informaciones se usa cuando una serie de datos incluye pocos valores, por lo cual resulta mas apropiada la palabra escrita como forma de escribir el comportamiento de los datos; mediante la forma escrita, se resalta la importancia de las informaciones principales.

2-Presentacin Tabular: Cuando los datos estadsticos se presentan a travs de un conjunto de filas y de columnas que responden a un ordenamiento lgico; es de gran eso e importancia para el uso e importancia para el usuario ya que constituye la forma ms exacta de presentar las informaciones. Una tabla consta de varias partes, las principales son las siguientes: 1. Titulo: Es la parte ms importante del cuadro y sirve para describir todo l contenido de este. 2. Encabezados: Son los diferentes subttulos que se colocan en la parte superior de cada columna. 3. Columna matriz: Es la columna principal del cuadro. 4. Cuerpo: El cuerpo contiene todas las informaciones numricas que aparecen en la tabla. 5. Fuente: La fuente de los datos contenidos en la tabla indica la procedencia de estos. Notas al pie: Son usadas para hacer algunas aclaraciones sobre aspectos que aparecen en la tabla o cuadro y que no han sido explicados en otras partes.

3-Presentacin Grafica: Proporciona al lector o usuario mayor rapidez en la comprensin de los datos, una grafica es una expresin artstica usada para representar un conjunto de datos.

De acuerdo al tipo de variable que vamos a representar, las principales graficas son las siguientes: Histograma: Es un conjunto de barras o rectngulos unidos uno de otro, en razn de que lo utilizamos para representar variables continuas.

26

Polgono de frecuencias: Esta grafica se usa para representar los puntos medios de clase en una distribucin de frecuencias Grfica de barras: Es un conjunto de rectngulos o barras separadas una de la otra, en razn de que se usa para representar variables discretas; las barras deben ser de igual base o ancho y separadas a igual distancia. Pueden disponerse en forma vertical y horizontal. Grfica lineal: Son usadas principalmente para representar datos clasificados por cantidad o tiempo; o sea, se usan para representar series de tiempo o cronolgicas. Grfica de barra 100% y grfica circular: se usan especialmente para representar las partes en que se divide una cantidad total. La ojiva: Esta grafica consiste en la representacin de las frecuencias acumuladas de una distribucin de frecuencias. Puede construirse de dos maneras diferentes; sobre la base menor que o sobre la base o ms. Puede determinar el valor de la mediana de la distribucin.

Anlisis de Datos Bajo la denominacin "anlisis de datos" se engloba en estadstica a un conjunto de mtodos descriptivos multidimensionales. Para aplicar estos mtodos, se necesita que la informacin est organizada de la manera siguiente: "n" individuos estadsticos (entidades espaciales, parejas, firmas,...) descritos por "p" variables. Estos mtodos permiten resumir la informacin contenida en las tablas de datos en dimensiones importantes (tabla de n lneas por p columnas). Se pueden distinguir dos "familias" de mtodos:

Los anlisis factoriales: consisten en transformar la tabla de datos inicial en una nueva tabla que contiene la misma informacin, pero bajo forma jerarquizada. Est compuesta de ejes factoriales. El primer eje factorial corresponde a la combinacin lineal de variables inciales, que diferencia al mximo a los individuos entre ellos. ste es de varianza mxima. Los ejes factoriales son independientes unos de otros y estn clasificados en funcin de su varianza.

27

La interpretacin de estos ejes factoriales permite poner en evidencia la forma de las interrelaciones entre las variables estudiadas, y las semejanzas y diferencias entre los individuos con respecto a esas variables. Los dos mtodos ms comnmente utilizados son el anlisis en componentes principales (adaptado para datos heterogneos que combinan variables expresadas en escalas de medida diferentes, o incluso para variables expresadas en porcentajes), y el anlisis de correspondencias (adaptado para tablas de contingencia o variables cualitativas).

Las clasificaciones: permiten elaborar tipologas y agrupar individuos por clases en funcin de sus semejanzas con respecto al conjunto de las variables. Un criterio empleado a menudo desde el punto de vista tcnico es el de buscar la clasificacin que minimiza la varianza intraclase (variabilidad entre los individuos de una misma clase), y maximiza la varianza interclase (variabilidad entre las clases). Los mtodos ms clsicos son la clasificacin jerrquica ascendente, y la clasificacin por nubes dinmicas.

Representaciones Graficas Los grficos son medios popularizados y a menudo los ms convenientes para presentar datos, se emplean para tener una representacin visual de la totalidad de la informacin. Los grficos estadsticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fcilmente los hechos esenciales y compararlos con otros.

Histogramas de Frecuencias En estadstica, un histograma es una representacin grfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente sealando las marcas de clase, es decir, la mitad del intervalo en el que estn agrupados los datos.

28

Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (nonumricos), como sexo, grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores.

Los histogramas son ms frecuentes en ciencias sociales, humanas y econmicas que en ciencias naturales y exactas. Y permite la comparacin de los resultados de un proceso.

Polgonos de Frecuencia Este grfico se utiliza para el caso de variables cuantitativas, tanto discretas como continuas, partiendo del diagrama de columnas, barras o histograma, segn el tipo de tabla de frecuencia manejada. Consiste en una serie de segmentos que unen los puntos cuyas abscisas son los valores centrales de cada clase y cuyas ordenadas son proporcionales a sus frecuencias respectivas.

29

Representacin Grafica por Sectores En los diagramas de sectores, tambin llamados circulares o de tarta, se muestra el valor de la frecuencia de la variable sealada como un sector circular dentro de un crculo completo. Por ello, resultan tiles particularmente para mostrar comparaciones entre datos, sobre todo en forma de frecuencias relativas de las variables expresadas en forma de porcentaje.

Medidas De Tendencia Central Una de las caractersticas ms sobresalientes de la distribucin de datos es su tendencia a acumularse hacia el centro de la misma. Esta caracterstica se denomina Tendencia central. Las medidas de tendencia central ms usuales son: a) media aritmtica (x), el valor medio. b) mediana, el valor central. c) moda, el valor ms frecuente.

Media Aritmtica La medida de tendencia central mas ampliamente usada es la media aritmtica, usualmente abreviada como media. La media aritmtica de un conjunto de n valores es el resultado de la suma de todos ellos dividido entre n.

Propiedades De La Media Aritmtica 1. Puede ser calculada en distribuciones con escala relativa e intervalar. 2. Todos los valores son incluidos en el cmputo de la media.

30

3. Una serie de datos solo tiene una media. 4. Es una medida muy til para comparar dos o ms poblaciones. 5. Es la nica medida de tendencia central donde la suma de las desviaciones de cada valor respecto a la media es igual a cero. Por lo tanto podemos considerar a la media como el punto de balance de una serie de datos.

La Media Para Datos Agrupados Frecuentemente los datos ests agrupados y presentados en forma de distribucin de frecuencias. Si esto sucede es normalmente imposible recuperar los datos crudos originales. Por consiguiente si queremos calcular la media u otro estadstico es necesario estimarlo en base a la distribucin de frecuencias. La media aritmtica de una muestra de datos organizados en una distribucin de frecuencias se calcula de la siguiente manera: Sfx = n

Donde: simboliza la media de la muestra x f S fx n Ejemplo: Calcular la media aritmtica de la siguiente distribucin de frecuencia del nmero de meses de duracin de una muestra de 40 bateras para coche. es la marca de clase es la frecuencia de clase es la suma de los productos de f por X es la suma de las frecuencias de clase

31

duracin de las bateras (meses) Nmero de bateras 15 - 19 20 - 24 25 - 29 30 - 34 35 - 39 40 - 44 45 - 49 2 1 4 15 10 5 3

Damos como un hecho que ya sabemos elaborar una distribucin de frecuencias, si se quiere ver como se elabor vaya a la seccin de ese tema en este mismo sitio. Primeramente, de la distribucin de frecuencias que ya tenemos, utilizaremos la marca de clase y la frecuencia de clase, para despus calcular el producto fX y proceder finalmente a calcular la sumatoria SfX y aplicar la frmula.

LI 15 20 25 30 35 40 45

LS 19 24 29 34 39 44 49

X 17 22 27 32 37 42 47

F 2 1 4 15 10 5 3

FX 34 22 108 480 370 210 141

32

n =40 Sfx = n = 40 1365 = 34.12

SfX = 1365

La Media Para Datos No Agrupados Para datos crudos, es decir datos no agrupados, la media es la suma de todos los valores dividida entre el nmero total de valores. Para encontrar la media de una muestra se usa la siguiente frmula: Sx = n

Donde: es la media de la muestra Sx n es la suma de todos los valores de la muestra es el nmero de elementos de la muestra

Ejemplo: El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la lnea de produccin son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. Cul es la media aritmtica de estas observaciones?

Sx = n =

85.4 + 85.3 + 84.9 + 85.4 + 84.0 = 85.0 5

La Media De La Muestra Y La Media De La Poblacin Las medidas caractersticas de una muestra son llamadas estadsticos y las medidas caractersticas de una poblacin se denominan parmetros. La media de

33

la poblacin se calculan de la misma manera que la media de la muestra, que calculamos arriba, pero tiene diferente notacin: Sx m = N

Donde: m Sx N es la media de la poblacin es la suma de todos los valores de la poblacin es el nmero de elementos de la poblacin

La Mediana Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeos, la media aritmtica no es representativa. El valor central en tales problemas puede ser mejor descrito usando una medida de tendencia central llamada mediana. La mediana es el punto medio de los valores de una serie de datos despus de haber sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como posteriores en el arreglo de datos.

Ejemplo: El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la lnea de produccin son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. Cul es la mediana de las observaciones muestreadas? 85. 4 85. 4 85.3 g 84.9 84.0

34

Ejemplo: Una muestra de los honorarios de paramdicos cargados por la clnica Baltimore revel estas cantidades: $35, $29, $30, $25, $32, $35. Cul es la mediana? 25 29 30 32 35 35 g

En este caso la mediana se calcula obteniendo la media de las dos observaciones centrales

30 + 32 = 2 = 31

La Mediana Para Datos Agrupados Cuando los datos se encuentran agrupados en una distribucin de frecuencia no conocemos los datos originales, por lo tanto es necesario estimar la mediana mediante los siguientes pasos: 1. Calcular el valor n / 2 2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo mediano). Esto se hace encontrando el primer intervalo de clase donde la frecuencia acumulada es igual o mayor que n / 2. 3. Aplicando la siguiente frmula con los valores del intervalo mediano:

( n/2 - FA ) tic = LSR + F

35

Ejemplo: Calcular mediana de la siguiente distribucin de frecuencia del nmero de meses de duracin de una muestra de 40 bateras para coche.

duracin de las bateras (meses) Nmero de bateras 15 - 19 20 - 24 25 - 29 30 - 34 35 - 39 40 - 44 45 - 49 2 1 4 15 10 5 3

Para calcular la mediana de una distribucin de frecuencias necesitamos que tenga las columnas de lmite superior real (LSR), frecuencia acumulada (FA), frecuencia (F). 1. El valor de ( n / 2 ) = 40 / 2 = 20 2. El intervalo mediano es:

LI 15 20 25

LS 19 24 29

LSR 19.5 24.5 29.5 34.5

X 17 22 27 32

F 2 1 4

FA 2 3 7 g intervalo mediano

30 34

15 22

36

35 40 45

39 44 49

39.5 44.5 49.5

37 42 47

10 32 5 3 37 40

N = 40

3. Aplicar la frmula con los datos del intervalo mediano: ( n/2 - FA ) tic = LSR + F = 34.5 + ( 20 - 22 )( 5 ) = 33.83

Modo o Moda La moda o clase modal es el dato o clase de mayor frecuencia. La moda es el valor o el intervalo que se repite ms veces en una variable. Dicho de otra manera: es aquel valor o categora de la variable que presenta la mayor frecuencia en una distribucin. Sirve como descripcin de la variable en el sentido de ser el dato o clase ms representativo por ser el ms frecuente. Como puede existir ms de una clase o dato con la mxima frecuencia, la moda no es necesariamente nica.

Aquellas distribuciones que tienen una sola moda se llaman unimodales; cuando hay dos modas se dice que la distribucin es bimodal y si hay ms de dos modas la distribucin se llama multimodal. Si bien la moda es la nica medida descriptiva importante de las variables nominales, en las ordinales, tambin podemos calcular la mediana. La mediana es el valor que la variable que deja, por encima y por debajo, el 50% de los casos. Es la categora o valor de la distribucin que posee el orden medio cuando las observaciones aparecen

ordenas segn las categoras de la variable. La mediana tiene ms sentido de ser hallada en las variables cuantitativas.

37

En el caso de variables cualitativas generalmente lo que conviene es dar porcentajes de clases agrupadas (oponiendo as, por ejemplo, aquellas categoras que muestran aceptacin a las que no, de forma de establecer porcentajes diferenciales). Ejemplo El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la lnea de produccin son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. Cul es la moda de las observaciones muestreadas? = 85.4

La Moda Para Datos Agrupados Para datos agrupados en una distribucin de frecuencia, la moda puede ser estimada por la marca de clase del intervalo que contenga la frecuencia de clase ms grande. Si hay dos intervalos contiguos con frecuencia mxima la moda ser la media aritmtica de las dos marcas de clase. Si hay dos o ms intervalos no contiguos con frecuencia de clase mxima habr dos o ms modas que sers las marcas de clase de dichos intervalos.

Ejemplo: Calcular las modas de las siguientes distribuciones de frecuencia:

X 5

F 4

X 5

F hay dos modas: 4 = 10

X 5

F 4

no hay moda

10 3 15 15 20 9 25 10 30 7

10 8 15 6 20 7 25 8

10 4 15 4 20 4 25 4

= 15

= (25+30) / 2 = 27.5 30 8 30 4

38

Medidas de Posicin Son indicadores usados para sealar que porcentaje de datos dentro de una distribucin de frecuencias superan estas expresiones, cuyo valor representa el valor del dato que se encuentra en el centro de la distribucin de frecuencia, por lo que tambin se les llama " Medidas de Tendencia Central ". Pero estas medidas de posicin de una distribucin de frecuencias han de cumplir determinadas condiciones para que lean verdaderamente representativas de la variable a la que resumen. Toda sntesis de una distribucin se considerara como operativa si intervienen en su determinacin todos y cada uno de los valores de la distribucin, siendo nica para cada distribucin de frecuencias y siendo siempre calculable y de fcil obtencin.

A continuacin se describen las medidas de posicin ms comunes utilizadas en estadstica, como lo son:

Cuartiles: Hay 3 cuartiles que dividen a una distribucin en 4 partes iguales: primero, segundo y tercer cuartil.

Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno decil).

Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (primero al noventa y nueve percentil).

Cuartiles (Q1, Q2, Q3) a. Primer cuartil (Q1): Aquel valor de una serie que supera al 25% de los datos y es superado por el 75% restante.

Formula de Q1 para series de Datos Agrupados en Clase.

39

Donde:

: Posicin de Q1, la cual se localiza en la primera frecuencia acumulada que la contenga, siendo la clase de Q1, la correspondiente a tal frecuencia acumulada. Li, faa, fi, Ic : idntico a los conceptos vistos para Mediana pero referidos a la medida de la posicin correspondiente.

b. Segundo cuartil (Q2): Coincide, es idntico o similar al valor de la Mediana (Q2 = Md). Es decir, supera y es superado por el 50% de los valores de una Serie.

c. Tercer cuartil (Q3): Aquel valor, termino o dato que supera al 75% y es superado por el 25% de los datos restantes de la Serie.

Formula de Q3 para series de Datos Agrupados en Clase.

Donde:

: Posicin de Q3, todo idntico al clculo de la Mediana. Deciles (D1, D2, D9) Primer Decil (D1), Quinto Decil (D5) y Noveno Decil (D9). El primer decil es aquel valor de una serie que supera a 1/10 parte de los datos y es superado por las 9/10 partes restantes (respectivamente, hablando en porcentajes, supera al 10% y es superado por el 90% restante),

40

El D9 (noveno decil) supera al 90% y es superado por el 10% restante.

Como se observa, son formulas parecidas a la del calculo de la Mediana, cambiando solamente la respectivas posiciones de las medidas.

Percentiles (P1, P2, P99) Primer Percentil (P1), Percentil 50 (P50) y Percentil 99 (P99). El primer percentil supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restante. Formulas de P1, P50, P99 para series de Datos Agrupados en Clase.

El P99 (noventa y nueve percentil) supera al 99% de los datos y es superado a su vez por el 1% restante.

41

Idnticas formulas al clculo de la Mediana, cambiando obviamente las correspondientes posiciones de cada medida.

Para determinar estas medidas se aplicara el principio de la mediana; as, el primer cuartil cereal valor por debajo del cual se encuentra el 25 por ciento de los datos; bajo el tercer cuartil se encuentra el 75 por ciento; el 80 decil ser el valor por encima del cual estar el 20 por ciento de los datos, etc.

Como se observa, todas estas medidas no son sino casos particulares del percentil ya que el primer cuartil no es sino el 25 percentil, el tercer cuartil el 75 percentil, el cuarto decil el 40 percentil, etc.

Datos No Agrupados: Se hace difcil calcular estas medidas, sin embargo, siguiendo los mismos principios mencionados para la Mediana, se pueden localizar en la forma siguiente: Si tenemos una serie de valores X1, X2, X3 Xn, se localiza el primer cuartil como el valor cuartil ser cuando n es par, y (n par); (n impar). o donde A representa el nmero del cuando n es impar. Para el tercer

En caso de los textiles ser textil. Para los deciles ser percentiles o o .

siendo A el nmero del decil; y para los

Ejemplo: En una serie de 32 trminos se desea localizar el 4 sextil, 8 decil y el 95 percentil.

42

Esto significa que el 4 textil se encuentra localizado en el termino numero 21, es decir, el que ocupa la 21 posicin; el 8 decil se encuentra localizado entre el termino numero 25 y 26 ; y el 95 percentil entre la posicin 30 y 31 .

Calculo Para Una Distribucin De Frecuencia Para el clculo de esta medida en datos agrupados en una distribucin de frecuencia, se utiliza el mismo procedimiento estudiado para el clculo de la Mediana, e; cual es:

1. Se efecta la columna de las frecuencias acumuladas. 2. Se determina la posicin del trmino cuyo valor se pretende calcular, en

caso de ser el primer cuartil ser

, si fuese el 95 centil

etc. 3. Se verifica cual es la clase que lo contiene; para ello se utiliza la columna de las frecuencias acumuladas. 4. Se hace la diferencia entre el nmero que representa el orden de posicin cuyo valor se pretende calcular y la frecuencia acumulada de la clase anterior a la que lo contiene. 5. Se calcula la medida solicitada de acuerdo a la siguiente frmula:

43

Donde: 1i: limite inferior de la clase que lo contiene. P: valor que representa la posicin de la medida. fi: la frecuencia de la clase que contiene la medida solicitada. fa-1: frecuencia acumulada anterior a la que contiene la medida solicitada. Ic: intervalo de clase.

Ejemplo: Determinacin del primer cuartil, el cuartil textil, el sptimo decil y el 30 percentil. Salarios (I. de Clases) 200 299 300 399 400 499 500 599 600 699 700 800 N de empleados fa (fi) 85 90 120 70 62 36 85 175 295 365 427 463

44

Estos resultados nos indican que el 25 por ciento de los empleados ganan salarios por debajo de Bs. 334; que sobre Bs. 519,51 ganan el 33,33 por ciento de los empleados; que bajo 541,57 gana el 57 por ciento de los empleados y sobre Bs. 359,88 gana el 70 por ciento de los empleados.

Muchas veces necesitamos conocer el porcentaje de valores que esta por debajo o por encima de un valor dado; lo que representa un problema contrario al anterior, esto es, dado un cierto valor en la abscisa determinar en la ordenada el tanto por ciento de valores inferiores y superiores al valor dado. Operacin que se resuelve utilizando la siguiente formula general:

Donde: P: lugar percentil que se busca. P: valor reconocido en la escala X. fa-1: frecuencia acumulada de la clase anterior a la clase en que esta incluida P. fi: frecuencia de la clase que contiene a p. Li: limite inferior de la clase que contiene a P. Ic: intervalo de clase. N: frecuencia total.

Ejemplo: Utilizando la distribucin anterior, determinar que porcentaje de personas ganan salarios inferiores a Bs. 450,00

45

El 50,75 por ciento de las personas ganan salarios inferiores a Bs. 450.

Mtodo Grfico Para Fraccionar La Distribucin Se pueden obtener en forma grfica, a travs de la curva de la frecuencia acumulada (ojiva). Para ello basta despus de trazar la ojiva, llevar el orden de posicin de la medida que se quiere sobre la ordenada, trazar por ese punto una perpendicular toca a la ojiva, baja una paralela a la ordenada hasta tocar la abscisa; en el punto donde toque a dicho eje, se encontrar el valor buscado.

Obtencin Grfica De Las Medidas De Posicin Similar o idntico a la distribucin grafica de la Mediana con la sola excepcin de que se llevara al eje vertical (frecuencias acumuladas) las especificas posiciones de cada indicador de posicin en particular. Ejemplo: Forma de obtener los indicadores de posicin (cuartiles, deciles y percentiles) para series de datos agrupados en clases: Supongamos la siguiente distribucin de frecuencias referidas a las estaturas que representaban 40 alumnos de un curso.

(I. de Clases) Estaturas N alumnos (mts) 1,60 1,64 ** 1,68 * 1,72 1,76 1,639 1,679 1,719 1,759 1,80 (fi) 5 8 15 10 2

fa

5 13 ** 28 38 * 40

Q3=?

46

La cual se ubica en la primera fa que la contenga

Esta estatura de Q3 = 1,73 mts. Supera en la distribucin de frecuencia al 75% de los alumnos del curso y es superada por el 25% de los mismos. D8 = ?

supera esta estatura de 1,736 mts a 8/10 partes de curso y es superado por las 2/10 partes restantes. P55 = ?

47

Esta estatura supera al 55% de los alumnos del curso y es superada por el 45% restante.

Calcular de cada uno de los intervalos de clases cuartiles, deciles y percentiles.

Datos Agrupados I. de clases fi 10 15 16 21 22 27 28 33 34 39 40 45 46 51 52 57 n = 66 Cuartiles: fa

10 10 18 28 10 38 8 9 7 3 1 46 55 62 65 66

48

49

Deciles:

50

51

Percentiles:

52

53

Medidas de Dispersin o de Variabilidad El conocimiento de la forma de la distribucin y del respectivo promedio de una coleccin de valores de una variable, puede servir para tener una idea bastante clara de la conformacin, pero no de de la homogeneidad de cada una de los valores con respecto a la medida de tendencia central aplicada. En el caso de las variables con valores que pueden definirse en trminos de alguna escala de medida de igual intervalo, puede usarse un tipo de indicador que permite apreciar el grado de dispersin o variabilidad existente en el grupo de variantes en estudio.

A estos indicadores les llamamos medidas de dispersin, por cuanto que estn referidos a la variabilidad que exhiben los valores de las observaciones, ya que si no hubiere variabilidad o dispersin en los datos inters, entonces no habra necesidad de la gran mayora de las medidas de la estadstica descriptiva.

La Dispersin Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda slo nos revelan una parte de la informacin que necesitamos acerca de las caractersticas de los datos. Para aumentar nuestro entendimiento del patrn de los datos, debemos medir tambin su dispersin, extensin o variabilidad. La dispersin es importante porque:

54

Proporciona informacin adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posicin central es menos representativa de los datos.

Ya que existen problemas caractersticos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersin antes de abordar esos problemas.

Quiz se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersin de valores con respecto al centro de distribucin o esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones ms grandes. Pero si hay dispersin en la mayora de los datos, y debemos estar en

capacidad de describirla. Ya que la dispersin ocurre frecuentemente y su grado de variabilidad es importante, cmo medimos la variabilidad de una distribucin emprica?. Vamos a considerar slo algunas medidas de dispersin absolutas: el rango, la varianza, la desviacin estndar y el coeficiente de variacin.

El Rango O Recorrido ( R ) Es la medida de variabilidad ms fcil de calcular. Para datos finitos o sin agrupar, el rango se define como la diferencia entre el valor ms alto (Xn Xmax.) y el ms bajo (X1 Xmin) en un conjunto de datos.

Rango Para Datos No Agrupados R = Xmx.-Xmn = Xn-X1

Ejemplo: Se tienen las edades de cinco estudiantes universitarios de Ier ao, a saber: 18,23, 27,34 y 25., para calcular la media aritmtica (promedio de las edades, se tiene que: R = Xn-X1 ) = 34-18 = 16 aos

55

Con datos agrupados no se saben los valores mximos y mnimos. Si no hay intervalos de clases abiertos podemos aproximar el rango mediante el uso de los lmites de clases. Se aproxima el rango tomando el lmite superior de la ltima clase menos el lmite inferior de la primera clase.

Rango Para Datos Agrupados R= (lim. Sup. de la clase n lim. Inf. De la clase 1)

Ejemplo: Si se toman los datos del ejemplo resuelto al construir la tabla de distribucin de frecuencia de las cuentas por cobrar de Cabreras y Asociados que fueron los siguientes: Clases P.M. Xi 7.420 21.835 14.628 10 0.33 10 0.13 14 0.17 19 0.10 22 0.10 25 0.17 30 30 20 16 11 8 5 0.33 1.00 0.46 0.67 0.63 0.54 0.73 0.37 0.83 0.27 1.00 0.17 fi fr fa fa fra fra

21.835 36.250 29.043 4 36.250 50.665 43.458 5 50.665 65.080 57.873 3 65.080 79.495 72.288 3 79.495 93.910 86.703 5 Total XXX

30 1.00 XXX XXX XXX XXX

El rango de la distribucin de frecuencias se calcula as: R= (lim. Sup. de la clase n lim. Inf. De la clase 1) = (93.910 7.420) = 86.49

La Varianza (S2 2 ): La varianza es una medida de dispersin relativa a algn punto de referencia. Ese punto de referencia es la media aritmtica de la distribucin. Ms

56

especficamente, la varianza es una medida de que tan cerca, o que tan lejos estn los diferentes valores de su propia media aritmtica. Cuando ms lejos estn las Xi de su propia media aritmtica, mayor es la varianza; cuando ms cerca estn las Xi a su media menos es la varianza. Y se define y expresa matemticamente de la siguiente manera:

La Varianza Para Datos No Agrupados Dado un conjunto de observaciones, tales como X1, X2, , Xn, la varianza denotada usualmente por la letra minscula griega (sigma) elevada al cuadrado (2)y en otros casos S2 segn otros analistas, se define como: el cuadrado medio de las desviaciones con respecto a su media aritmtica"

Matemticamente, se expresa como:

Ejemplo: Se tienen las edades de cinco estudiantes universitarios de Ier ao, a saber: 18,23, 25, 27, y 34. Al calcular la media aritmtica (promedio de las edades, se obtuvo 25.4 aos, encontrar la varianza de las edades de estos estudiantes:

Para calcular se utiliza una tabla estadstica de trabajo de la siguiente manera:

57

( Xi Xi 18 23 25 27 34 Total ( Xi )

)2

(18 25.5)=-7.4 (23 25.5)=-2.4 (25 25.5)=-0.4 (27 25.5)= 1.6 (34 25.5)= 8.6 xxxx

(-7.4)2=54.76 (-2.4)2= 5.76 (-0.4)2= 0.16 ( 1.64)2= 2.16 ( 8.6)2 =73.96 137.20

Respuesta: la varianza de las edades es de 27.4 aos

La Varianza Para Datos Agrupados Si en una tabla de distribucin de frecuencias. Los puntos medios de las clases son X1, X2, , Xn; y las frecuencias de las clases f1, f2, , fn; la varianza se calcula as:

(Xi- )2f1

58

2 = ---------------fi Sin embargo la formula anterior tiene algn inconveniente para su uso en la practica, sobre todo cuando se trabaja con nmeros decimales o cuando la media aritmtica es un nmero entero. Asimismo cuando se trabaja con mquinas calculadoras, La tarea de computar la varianza se simplifica utilizando la formula de computacin que se da a continuacin: Xi2fi - [(Xifi)2/N] 2 = ---------------------------N donde N=fi Ejemplo: Se tienen los datos de una muestra de 30 cuentas por cobrar de la tienda Cabreras y Asociados dispuestos en una tabla de distribucin de frecuencias, a partir de los cuales se deber calcular la varianza, para lo cual se construye la siguiente tabla estadstica de trabajo, si se calcul anteriormente la media aritmtica y se fij en 43.458 (ver ejemplo del calculo en "media aritmtica para datos agrupados) de la siguiente manera

Punto clases medios Xi 7.420 21.835 21.835 36.250 36.250 50.665 50.665 65.080 65.080 79.495 79.495 93.910 Total 14.628 29.043 43.458 57.873 72.288 86.703 XXX

fi

Xi2

Xifi

X2fi

10 4 5 3 3 5 30

213.978 843,496 1,888.598 3,349.284 5,225.555 7,533.025 19,053.936

146.280 116.172 217.270 173.619 216.864 433.965 1,304.190

2,139.780 3,373.984 9,442.990 10,047.852 15,676.665 37,665.125 78,346.396

59

= 21,649.344 / 30 = 721.645

Respuesta: la varianza de las cuentas por cobrar es igual B/.721.645

Propiedades De La Varianza

Siempre un valor no negativo, que puede ser igual o distinta de 0. Ser 0 solamente cuando Xi=

La varianza es la medida de dispersin cuadrtica ptima por ser la menor de todas.

Si a todos los valores de la variable se le suma una constante la varianza no se modifica. Vemoslo:

Si a xi le sumamos una constante xi = xi + k tendremos (sabiendo que )

Si todos los valores de la variable se multiplican por una constante la varianza queda multiplicada por el cuadrado de dicha constante. Vemoslo:

Si a xi = xi k tendremos (sabiendo que

60

Si en una distribucin obtenemos una serie de subconjuntos disjuntos, la varianza de la distribucin inicial se relaciona con la varianza de cada uno de los subconjuntos mediante la expresin

Siendo Ni el n de elementos del subconjunto (i) S2i la varianza del subconjunto (i) La Desviacin Estndar (S ) Es una medida de la cantidad tpica en la que los valores del conjunto de datos difieren de la media. Es la medida de dispersin ms utilizada, se le llama tambin desviacin tpica. La desviacin estndar siempre se calcula con respecto a la media y es un mnimo cuando se estima con respecto a este valor.

Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es la raz cuadrada positiva de esta. A la desviacin se le representa por la letra minscula griega "sigma" ( ) por la letra S mayscula, segn otros analistas.

Clculo de la Desviacin Estndar


= 2 S = S2

Ejemplo: Del calculo de la varianza de las edades de cinco estudiantes universitarios de primer ao se obtuvo 2=27.44, como la desviacin estndar es la raz cuadrada positiva, entonces = 27.44 = 5.29 aos. Igual procedimiento se aplica para encontrar le desviacin estndar de las cuentas por cobrar de la Tienda Cabreras y Asociados, recordemos que la varianza obtenida fue de 721.645, luego entonces la desviacin estndar es igual a =721.645 = 26.86 balboas.

61

El Coeficiente de Variacin de Pearson (C.V.) Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersin nos dicen hasta que punto estas medidas de tendencia central son representativas como sntesis de la informacin. Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central. Distinguimos entre medidas de dispersin absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirn comparar varias muestras.

Cuando se quiere comparar el grado de dispersin de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el llamado "Coeficiente de Variacin de Pearson", del que se demuestra que nos da un nmero independiente de las unidades de medidas empleadas, por lo que entre dos distribuciones dadas diremos que posee menor dispersin aquella cuyo coeficiente de variacin sea menor., y que se define como la relacin por cociente entre la desviacin estndar y la media aritmtica; o en otras palabras es la desviacin estndar expresada como porcentaje de la media aritmtica. Definicin del Coeficiente de Variacin

Donde: C.V. representa el nmero de veces que la desviacin tpica contiene a la media aritmtica y por lo tanto cuanto mayor es CV mayor es la dispersin y menor la representatividad de la media.

Propiedades del Coeficiente de Variacin : Si a todos los valores de la variable se le suma una misma constante el coeficiente de variacin queda alterado .

62

Ejemplo: Suponga que Usted trabaja en una compaa de ventas, que ofrece como premio de incentivo al mejor vendedor del trimestre anterior las entradas al palco empresarial en la serie final de bisbol de las grandes ligas en los Estados Unidos (E,E,U,A,). De los registros de ventas se tienen los siguientes datos de ventas, expresados en porcentajes de cumplimiento de las metas fijadas mensualmente: Vendedor A 95 105 100 Vendedor B 100 90 110

El promedio trimestral de cumplimiento de las metas de ventas de ambos vendedores es igual y equivale al 100%, pero Ud. Slo le puede dar el premio de incentivo a uno de ellos. Cul usted escogera?. En base a que criterio. Explique. Este problema se resuelve utilizando el coeficiente de variacin, para estos efectos es necesario encontrar la desviacin estndar trimestral de las ventas de cada uno de la siguiente manera:

Vendedor A Xi ( Xi ) ( Xi )2 95 105 100 Total 95 100 = -5 (-5)2 = 25 105 100 = 5 ( 5)2 = 25 100 100 = 0 ( 0)2 = 0 XXX 50

La desviacin estndar es =(50/3) = 16.667 = 4.08, luego entonces el coeficiente de variacin es igual a:

4.08 C.VA= --------- = ----------- = 0.0408 100

63

Vendedor B Xi 100 90 ( Xi ) ( Xi )2

100 100 = 0 90 100 = -10

( 0 )2 = 0 (-10)2 = 100

110

110 100 = 10

( 10)2 = 100

Total

XXX

200

La desviacin estndar es =(200/3) = 66.667 = 8.16, luego entonces el coeficiente de variacin es igual a:

Respuesta: Dado que el vendedor A tiene menor coeficiente de variacin, A l le corresponde recibir el premio de incentivo.

Medidas de Forma Coeficiente de Asimetra y de Curtosis Asimetra Hemos comentado que el concepto de asimetra se refiere a si la curva que forman los valores de la serie presenta la misma forma a izquierda y derecha de un valor central (media aritmtica)

64

Para medir el nivel de asimetra se utiliza el llamado Coeficiente de Asimetra de Fisher, que viene definido:

Los resultados pueden ser los siguientes: g 1 = 0 (distribucin simtrica; existe la misma concentracin de valores a la derecha y a la izquierda de la media) g1 > 0 (distribucin asimtrica positiva; existe mayor concentracin de valores a la derecha de la media que a su izquierda) g1 < 0 (distribucin asimtrica negativa; existe mayor concentracin de valores a la izquierda de la media que a su derecha) Ejemplo: Vamos a calcular el Coeficiente de Asimetra de Fisher de la serie de datos referidos a la estatura de un grupo de alumnos. Variable (Valor) x 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30 Frecuencias absolutas Simple x 1 4 4 2 1 2 3 3 4 3 3 Acumulada x 1 5 9 11 12 14 17 20 24 27 30 Frecuencias relativas Simple x 3,3% 13,3% 13,3% 6,6% 3,3% 6,6% 10,0% 10,0% 13,3% 10,0% 10,0% Acumulada x 3,3% 16,6% 30,0% 36,6% 40,0% 46,6% 56,6% 66,6% 80,0% 90,0% 100,0%

65

Recordemos que la media de esta muestra es 1,253

S ((xi - x)^3)*ni x 0,000110

S ((xi - x)^2)*ni x 0,030467

Luego:

(1/30) * 0,000110 g1 ------------------------------------------------- = = (1/30) * (0,030467)^(3/2) 0,1586 -

Por lo tanto el Coeficiente de Fisher de Simetra de esta muestra es 0,1586, lo que quiere decir que presenta una distribucin asimtrica negativa (se concentran ms valores a la izquierda de la media que a su derecha).

Curtosis El Coeficiente de Curtosis analiza el grado de concentracin que presentan los valores alrededor de la zona central de la distribucin. Se definen 3 tipos de distribuciones segn su grado de curtosis: Distribucin mesocrtica: presenta un grado de concentracin medio alrededor de los valores centrales de la variable (el mismo que presenta una distribucin normal). Distribucin leptocrtica : presenta un elevado grado de concentracin alrededor de los valores centrales de la variable. Distribucin platicrtica: presenta un reducido grado de concentracin alrededor de los valores centrales de la variable.

66

El Coeficiente de Curtosis viene definido por la siguiente frmula:

Los resultados pueden ser los siguientes: g 2 = 0 (distribucin mesocrtica) . g2 > 0(distribucin leptocrtica ). g2 < 0 (distribucin platicrtica) .

Ejemplo: Vamos a calcular el Coeficiente de Curtosis de la serie de datos referidos a la estatura de un grupo de alumnos. Recordemos que la media de esta muestra es 1,253

S ((xi - xm)^4)*ni x 0,00004967

S ((xi - xm)^2)*ni x 0,03046667

Luego:

(1/30) * 0,00004967 g2 ------------------------------------------- - = -1,39 = ((1/30) * (0,03046667))^2 3

67

Por lo tanto, el Coeficiente de Curtosis de esta muestra es -1,39, lo que quiere decir que se trata de una distribucin platicrtica, es decir, con una reducida concentracin alrededor de los valores centrales de la distribucin, aunque tampoco en este caso esta deviacin de la simetra est suficientemente alejada del 0 para ser considerada significativa (se encuentra entre -2 y 2).

68

CONCLUSIN

Se puede decir que

la estadstica es el estudio de los mtodos y

procedimientos para recoger, clasificar, resumir y analizar datos y para hacer inferencias cientficas partiendo de tales datos Esta definicin cubre gran parte de la actividad del cientfico. Es importante observar que el objeto del que realiza el anlisis estadstico son los datos y las observaciones cientficas por s mismos, mas que el material qumico que interviene en el estudio. Por lo tanto no es posible trazar lmites rgidos entre la qumica, la estadstica y la matemtica.

La estadstica se puede dividir en 2 categoras, la estadstica descriptiva y la inferencia estadstica. La estadstica descriptiva implica la abstraccin de varias propiedades de conjuntos de observaciones, mediante el empleo de mtodos grficos, tabulares numricos. Entre estas propiedades, estn la frecuencia con que se dan varios valores en la observacin, la nocin de un valor tpico o usual, la cantidad de variabilidad en un conjunto de datos observados y la medida de relaciones entre 2 mas variables.

El campo de la estadstica descriptiva no tiene que ver con las implicaciones o conclusiones que se puedan deducir de conjuntos de datos. La estadstica descriptiva sirve como mtodo para organizar datos y poner de manifiesto sus caractersticas esenciales con el propsito de llegar a conclusiones.

La inferencia estadstica se basa en las conclusiones a la que se llega por la ciencia experimental basndose en informacin incompleta. Por ejemplo, Mendel al estudiar la manera como diferan entre s las plantas de guisantes en altura, color de las semillas, color de las vainas y color de las flores, tuvo que hacer sus conclusiones necesariamente basndose en un grupo de plantas relativamente poco numeroso comparado con toda la poblacin de plantas de guisantes de un tipo particular.

69

Los grficos se han de explicar enteramente por s mismos. El contenido de un grfico deber ser tan completo como sea posible. Las escalas vertical y horizontal estarn rotuladas con claridad dando las unidades pertinentes. La mayoras de los grficos presentan informacin numrica con escalas, que deben rotularse para describir completamente la variable presentada en la escala y para variables de medida se dirn las unidades de medicin. No se debe tratar de abarcar demasiada informacin en un solo grfico. Es mejor hacer varios grficos que comprimir toda la informacin en uno solo. Una regla prctica segura es evitar grficos que contengan ms de 3 curvas.

Los grficos tienen que dar una visin general y no una imagen detallada de un conjunto de datos. Las presentaciones detalladas se deben reservar para las tablas. Las tablas se explicarn por s mismas enteramente. como los grficos, se ha de dar suficiente informacin en el ttulo y en los encabezamientos de columnas y filas de la tabla para permitir que el lector identifique fcilmente su contenido. Las medidas de posicin en un conjunto de datos estn diseadas para proporcionar al analista algunas medidas cuantitativas de donde est el centro de los datos en una muestra. En las medidas de posicin se trata de encontrar medidas que sinteticen las distribuciones de frecuencias. En vez de manejar todos los datos sobre las variables, tarea que puede ser pesada, podemos caracterizar su distribucin de frecuencias mediante algunos valores numricos, eligiendo como resumen de los datos un valor central alrededor del cual se encuentran distribuidos los valores de la variable. La descripcin de un conjunto de datos, incluye como un elemento de importancia la ubicacin de stos dentro de un contexto de valores posibles.

70

BIBLIOGRAFA

Armando, Soto Negrin. Principios de Estadstica. Editorial Panapo. 1999. Ernesto, Rivas Gonzlez. Estadstica General. Ediciones de la Biblioteca. Caracas. 2000.

71

Potrebbero piacerti anche