Sei sulla pagina 1di 40

Historia

[editar] Origen
El trmino alemn Statistik, que fue primeramente introducido por Gottfried Achenwall (1749), designaba originalmente el anlisis de datos del Estado, es decir, la "ciencia del Estado" (tambin llamada aritmtica poltica de su traduccin directa del ingls). No fue hasta el siglo XIX cuando el trmino estadstica adquiri el significado de recolectar y clasificar datos. Este concepto fue introducido por el militar britnico Sir John Sinclair (1754-1835). En su origen, por tanto, la Estadstica estuvo asociada a los Estados, para ser utilizados por el gobierno y cuerpos administrativos (a menudo centralizados). La coleccin de datos acerca de estados y localidades contina ampliamente a travs de los servicios de estadstica nacionales e internacionales. En particular, los censos suministran informacin regular acerca de la poblacin. Ya se utilizaban representaciones grficas y otras medidas en pieles, rocas, palos de madera y paredes de cuevas para controlar el nmero de personas, animales o ciertas mercancas. Hacia el ao 3000 a. C. los babilonios usaban ya pequeos envases moldeados de arcilla para recopilar datos sobre la produccin agrcola y de los gneros vendidos o cambiados. Los egipcios analizaban los datos de la poblacin y la renta del pas mucho antes de construir las pirmides en el siglo XI a. C. Los libros bblicos de Nmeros y Crnicas incluyen en algunas partes trabajos de estadstica. El primero contiene dos censos de la poblacin de Israel y el segundo describe el bienestar material de las diversas tribus judas. En China existan registros numricos similares con anterioridad al ao 2000 a. C. Los antiguos griegos realizaban censos cuya informacin se utilizaba hacia el 594 a. C. para cobrar impuestos.

[editar] Orgenes en probabilidad


Los mtodos estadstico-matemticos emergieron desde la teora de probabilidad, la cual data desde la correspondencia entre Pascal y Pierre de Fermat (1654). Christian Huygens (1657) da el primer tratamiento cientfico que se conoce a la materia. El Arsconiectandi (pstumo, 1713) de Jakob Bernoulli y la Doctrina de posibilidades (1718) de Abraham de Moivre estudiaron la materia como una rama de las matemticas.1 En la era moderna, el trabajo de Kolmogrov ha sido un pilar en la formulacin del modelo fundamental de la Teora de Probabilidades, el cual es usado a travs de la estadstica. La teora de errores se puede remontar a la pera miscellnea (pstuma, 1722) de Roger Cotes y al trabajo preparado por Thomas Simpson en 1755 (impreso en 1756) el cual aplica por primera vez la teora de la discusin de errores de observacin. La reimpresin (1757) de este trabajo incluye el axioma de que errores positivos y negativos son igualmente

probables y que hay unos ciertos lmites asignables dentro de los cuales se encuentran todos los errores; se describen errores continuos y una curva de probabilidad. Pierre-Simon Laplace (1774) hace el primer intento de deducir una regla para la combinacin de observaciones desde los principios de la teora de probabilidades. Laplace represent la Ley de probabilidades de errores mediante una curva y dedujo una frmula para la media de tres observaciones. Tambin, en 1871, obtiene la frmula para la ley de facilidad del error (trmino introducido por Lagrange, 1744) pero con ecuaciones inmanejables. Daniel Bernoulli (1778) introduce el principio del mximo producto de las probabilidades de un sistema de errores concurrentes.

Fotografa de Ceres por el telescopio espacial Hubble. La posicin fue estimada por Gauss mediante el mtodo de mnimos cuadrados. El mtodo de mnimos cuadrados, el cual fue usado para minimizar los errores en mediciones, fue publicado independientemente por Adrien-Marie Legendre (1805), Robert Adrain (1808), y Carl Friedrich Gauss (1809). Gauss haba usado el mtodo en su famosa prediccin de la localizacin del planeta enanoCeres en 1801. Pruebas adicionales fueron escritas por Laplace (1810, 1812), Gauss (1823), James Ivory (1825, 1826), Hagen (1837), Friedrich Bessel (1838), W.F. Donkin (1844, 1856), John Herschel (1850) y Morgan Crofton (1870). Otros contribuidores fueron Ellis (1844), Augustus De Morgan (1864), Glaisher (1872) y Giovanni Schiaparelli (1875). La frmula de Peters para r, el probable error de una observacin simple es bien conocido. El siglo XIX incluye autores como Laplace, Silvestre Lacroix (1816), Littrow (1833), Richard Dedekind (1860), Helmert (1872), Hermann Laurent (1873), Liagre, Didion y Karl Pearson. Augustus De Morgan y George Boole mejoraron la presentacin de la teora. AdolpheQuetelet (1796-1874), fue otro importante fundador de la estadstica y quien introdujo la nocin del hombre promedio (lhommemoyen) como un medio de entender los fenmenos sociales complejos tales como tasas de criminalidad, tasas de matrimonio o tasas de suicidios.

[editar] Estado actual

Durante el siglo XX, la creacin de instrumentos precisos para asuntos de salud pblica (epidemiologa, bioestadstica, etc.) y propsitos econmicos y sociales (tasa de desempleo, econometra, etc.) necesit de avances sustanciales en las prcticas estadsticas. Hoy el uso de la estadstica se ha extendido ms all de sus orgenes como un servicio al Estado o al gobierno. Personas y organizaciones usan la estadstica para entender datos y tomar decisiones en ciencias naturales y sociales, medicina, negocios y otras reas. La estadstica es entendida generalmente no como un sub-rea de las matemticas sino como una ciencia diferente aliada. Muchas universidades tienen departamentos acadmicos de matemticas y estadstica separadamente. La estadstica se ensea en departamentos tan diversos como psicologa, educacin y salud pblica.

Regresin lineal - Grficos de dispersin en estadstica. Al aplicar la estadstica a un problema cientfico, industrial o social, se comienza con un proceso o poblacin a ser estudiado. Esta puede ser la poblacin de un pas, de granos cristalizados en una roca o de bienes manufacturados por una fbrica en particular durante un periodo dado. Tambin podra ser un proceso observado en varios instantes y los datos recogidos de esta manera constituyen una serie de tiempo. Por razones prcticas, en lugar de compilar datos de una poblacin entera, usualmente se estudia un subconjunto seleccionado de la poblacin, llamado muestra. Datos acerca de la muestra son recogidos de manera observacional o experimental. Los datos son entonces analizados estadsticamente lo cual sigue dos propsitos: descripcin e inferencia. El concepto de correlacin es particularmente valioso. Anlisis estadsticos de un conjunto de datos puede revelar que dos variables (esto es, dos propiedades de la poblacin bajo consideracin) tienden a variar conjuntamente, como si hubiera una conexin entre ellas. Por ejemplo, un estudio del ingreso anual y la edad de muerte podra resultar en que personas pobres tienden a tener vidas ms cortas que personas de mayor ingreso. Las dos variables se dicen que estn correlacionadas. Sin embargo, no se puede inferir inmediatamente la existencia de una relacin de causalidad entre las dos variables. El fenmeno correlacionado podra ser la causa de una tercera, previamente no considerada, llamada variable confusora.

Si la muestra es representativa de la poblacin, inferencias y conclusiones hechas en la muestra pueden ser extendidas a la poblacin completa. Un problema mayor es el de determinar que tan representativa es la muestra extrada. La estadstica ofrece medidas para estimar y corregir por aleatoriedad en la muestra y en el proceso de recoleccin de los datos, as como mtodos para disear experimentos robustos como primera medida, ver diseo experimental. El concepto matemtico fundamental empleado para entender la aleatoriedad es el de probabilidad. La estadstica matemtica (tambin llamada teora estadstica) es la rama de las matemticas aplicadas que usa la teora de probabilidades y el anlisis matemtico para examinar las bases tericas de la estadstica. El uso de cualquier mtodo estadstico es vlido solo cuando el sistema o poblacin bajo consideracin satisface los supuestos matemticos del mtodo. El mal uso de la estadstica puede producir serios errores en la descripcin e interpretacin, afectando las polticas sociales, la prctica mdica y la calidad de estructuras tales como puentes y plantas de reaccin nuclear. Incluso cuando la estadstica es correctamente aplicada, los resultados pueden ser difcilmente interpretados por un inexperto. Por ejemplo, el significado estadstico de una tendencia en los datos, que mide el grado al cual la tendencia puede ser causada por una variacin aleatoria en la muestra, puede no estar de acuerdo con el sentido intuitivo. El conjunto de habilidades estadsticas bsicas (y el escepticismo) que una persona necesita para manejar informacin en el da a da se refiere como cultura estadstica.

[editar] Mtodos estadsticos


[editar] Estudios experimentales y observacionales
Un objetivo comn para un proyecto de investigacin estadstica es investigar la causalidad, y en particular extraer una conclusin en el efecto que algunos cambios en los valores de predictores o variables independientes tienen sobre una respuesta o variables dependientes. Hay dos grandes tipos de estudios estadsticos para estudiar causalidad: estudios experimentales y observacionales. En ambos tipos de estudios, el efecto de las diferencias de una variable independiente (o variables) en el comportamiento de una variable dependiente es observado. La diferencia entre los dos tipos es la forma en que el estudio es conducido. Cada uno de ellos puede ser muy efectivo. Un estudio experimental implica tomar mediciones del sistema bajo estudio, manipular el sistema y luego tomar mediciones adicionales usando el mismo procedimiento para determinar si la manipulacin ha modificado los valores de las mediciones. En contraste, un estudio observacional no necesita manipulacin experimental. Por el contrario, los datos son recogidos y las correlaciones entre predictores y la respuesta son investigadas. Un ejemplo de un estudio experimental es el famoso experimento de Hawthorne el cual pretenda probar cambios en el ambiente de trabajo en la planta Hawthorne de la Western

Electric Company. Los investigadores estaban interesados en si al incrementar la iluminacin en un ambiente de trabajo, la produccin de los trabajadores aumentaba. Los investigadores primero midieron la productividad de la planta y luego modificaron la iluminacin en un rea de la planta para ver si cambios en la iluminacin afectaran la productividad. La productividad mejor bajo todas las condiciones experimentales. Sin embargo, el estudio fue muy criticado por errores en los procedimientos experimentales, especficamente la falta de un grupo control y seguimiento. Un ejemplo de un estudio observacional es un estudio que explora la correlacin entre fumar y el cncer de pulmn. Este tipo de estudio normalmente usa una encuesta para recoger observaciones acerca del rea de inters y luego produce un anlisis estadstico. En este caso, los investigadores recogeran observaciones de fumadores y no fumadores y luego miraran los casos de cncer de pulmn en ambos grupos. Los pasos bsicos para un experimento son:
y

y y y

Planeamiento estadstico de la investigacin, lo cual incluye encontrar fuentes de informacin, seleccin de material disponible en el rea y consideraciones ticas para la investigacin y el mtodo propuesto. Se plantea un problema de estudio, Disear el experimento concentrndose en el modelo y la interaccin entre variables independientes y dependientes. Se realiza un muestreo consistente en la recoleccin de datos referentes al fenmeno o variable que deseamos estudiar. Se propone un modelo de probabilidad, cuyos parmetros se estiman mediante estadsticos a partir de los datos de muestreo. Sin embargo, se mantiene lo que se denominan hiptesis sostenidas (que no son sometidas a comprobacin). Se valida el modelo comparndolo con lo que sucede en la realidad. Se utiliza mtodos estadsticos conocidos como test de hiptesis o prueba de significacin. Se producen estadsticas descriptivas. Inferencia estadstica. Se llega a un consenso acerca de qu dicen las observaciones acerca del mundo que observamos. Se utiliza el modelo validado para tomar decisiones o predecir acontecimientos futuros. Se produce un reporte final con los resultados del estudio.

[editar] Niveles de medicin


Hay cuatro tipos de mediciones o escalas de medicin en estadstica. Los cuatro tipos de niveles de medicin (nominal, ordinal, intervalo y razn) tienen diferentes grados de uso en la investigacin estadstica. Las medidas de razn, en donde un valor cero y distancias entre diferentes mediciones son definidas, dan la mayor flexibilidad en mtodos estadsticos que pueden ser usados para analizar los datos. Las medidas de intervalo tienen distancias interpretables entre mediciones, pero un valor cero sin significado (como las mediciones de coeficiente intelectual o temperatura en grados Celsius). Las medidas ordinales tienen imprecisas diferencias entre valores consecutivos, pero un orden interpretable para sus valores. Las medidas nominales no tienen ningn rango interpretable entre sus valores.

La escala de medida nominal, puede considerarse la escala de nivel ms bajo. Se trata de agrupar objetos en clases. La escala ordinal, por su parte, recurre a la propiedad de orden de los nmeros. La escala de intervalos iguales est caracterizada por una unidad de medida comn y constante. Es importante destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no refleja en ningn momento ausencia de la magnitud que estamos midiendo. Esta escala, adems de poseer las caractersticas de la escala ordinal, permite determinar la magnitud de los intervalos (distancia) entre todos los elementos de la escala. La escala de coeficientes o Razones es el nivel de medida ms elevado y se diferencia de las escalas de intervalos iguales nicamente por poseer un punto cero propio como origen; es decir que el valor cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se observa una carencia total de propiedad, se dispone de una unidad de medida para el efecto. A iguales diferencias entre los nmeros asignados corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio.

[editar] Tcnicas de anlisis estadstico


Algunos tests y procedimientos para investigacin de observaciones bien conocidos son:
y y y y y y y y y y y y y y

Prueba t de Student Prueba de Anlisis de varianza (ANOVA) U de Mann-Whitney Anlisis de regresin Correlacin Iconografa de las correlaciones Frecuencia estadstica Anlisis de frecuencia acumulada Prueba de la diferencia menos significante de Fisher Coeficiente de correlacin producto momento de Pearson Coeficiente de correlacin de rangos de Spearman Anlisis factorial exploratorio Anlisis factorial confirmatorio

[editar] Disciplinas especializadas


Algunos campos de investigacin usan la estadstica tan extensamente que tienen terminologa especializada. Estas disciplinas incluyen:
y y y y y y y y

Ciencias actuariales Fsica estadstica Estadstica industrial Estadstica Espacial Matemticas Estadstica Estadstica en Medicina Estadstica en Medicina Veterinaria y Zootecnia Estadstica en Nutricin

y y y y y y y y y y y y y y y y y y y y y y y y y y y y y y y y y y y

Estadstica en Agronoma Estadstica en Planificacin Estadstica en Investigacin Estadstica en Restauracin de Obras Estadstica en Literatura Estadstica en Astronoma Estadstica en la Antropologa (Antropometra) Estadstica en Historia Estadstica militar Geoestadstica Bioestadstica Estadsticas de Negocios Estadstica Computacional Estadstica en las Ciencias de la Salud Investigacin de Operaciones Estadsticas de Consultora Estadstica de la educacin, la enseanza, y la formacin Estadstica en la comercializacin o mercadotecnia Cienciometra Estadstica del Medio Ambiente Estadstica en Epidemiologa Minera de datos (aplica estadstica y reconocimiento de patrones para el conocimiento de datos) Econometra (Estadstica econmica) Estadstica en Ingeniera Geografa y Sistemas de informacin geogrfica, ms especficamente en Anlisis espacial Demografa Estadstica en psicologa (Psicometra) Calidad y productividad Estadsticas sociales (para todas las ciencias sociales) Cultura estadstica Encuestas por Muestreo Anlisis de procesos y quimiometra (para anlisis de datos en qumica analtica e ingeniera qumica) Confiabilidad estadstica Procesamiento de imgenes Estadsticas Deportivas

La estadstica es una herramienta bsica en negocios y produccin. Es usada para entender la variabilidad de sistemas de medicin, control de procesos (como en control estadstico de procesos o SPC (CEP)), para compilar datos y para tomar decisiones. En estas aplicaciones es una herramienta clave, y probablemente la nica herramienta disponible.

[editar] Computacin estadstica

El rpido y sostenido incremento en el poder de clculo de la computacin desde la segunda mitad del siglo XX ha tenido un sustancial impacto en la prctica de la ciencia estadstica. Viejos modelos estadsticos fueron casi siempre de la clase de los modelos lineales. Ahora, complejos computadores junto con apropiados algoritmos numricos, han causado un renacer del inters en modelos no lineales (especialmente redes neuronales y rboles de decisin) y la creacin de nuevos tipos tales como modelos lineales generalizados y modelos multinivel. El incremento en el poder computacional tambin ha llevado al crecimiento en popularidad de mtodos intensivos computacionalmente basados en remuestreo, tales como tests de permutacin y de bootstrap, mientras tcnicas como el muestreo de Gibbs han hecho los mtodos bayesianos ms accesibles. La revolucin en computadores tiene implicaciones en el futuro de la estadstica, con un nuevo nfasis en estadsticas experimentales y empricas. Un gran nmero de paquetes estadsticos est ahora disponible para los investigadores. Los sistemas dinmicos y teora del caos, desde hace una dcada, empezaron a interesar en la comunidad hispana, pues en la anglosajona de Estados Unidos estaba ya establecida la conducta catica en sistemas dinmicos no lineales con 350 libros para 1997 y empezaban algunos trabajos en los campos de las ciencias sociales y en aplicaciones de la fsica. Tambin se estaba contemplando su uso en analtica.

[editar] Crticas a la estadstica


Hay una percepcin general de que el conocimiento estadstico es intencionado y frecuentemente mal usado, encontrando maneras de interpretar los datos que sean favorables al presentador. Un dicho famoso, al parecer de Benjamin Disraeli,2 es: Hay tres tipos de mentiras: mentiras pequeas, mentiras grandes y estadsticas. El popular libro Howto lie withstatistics (cmo mentir con las estadsticas) de DarrellHuff discute muchos casos de mal uso de la estadstica, con nfasis en grficas malintencionadas. Al escoger (o rechazar o modificar) una cierta muestra, los resultados pueden ser manipulados; por ejemplo, mediante la eliminacin selectiva de valores atpicos (outliers). Este puede ser el resultado de fraudes o sesgos intencionales por parte del investigador (Darrel Huff3 ). Lawrence Lowell (decano de la Universidad de Harvard) escribi en 1909 que las estadsticas, como algunos pasteles, son buenas si se sabe quin las hizo y se est seguro de los ingredientes. Algunos estudios contradicen resultados obtenidos previamente, y la poblacin comienza a dudar en la veracidad de tales estudios. Se podra leer que un estudio dice (por ejemplo) que hacer X reduce la presin sangunea, seguido por un estudio que dice que hacer X no afecta la presin sangunea, seguido por otro que dice que hacer X incrementa la presin sangunea. A menudo los estudios se hacen siguiendo diferentes metodologas, o estudios en muestras pequeas que prometen resultados maravillosos que no son obtenibles en estudios de mayor tamao. Sin embargo, muchos lectores no notan tales diferencias, y los medios de comunicacin simplifican la informacin alrededor del estudio y la desconfianza del pblico comienza a crecer.

Sin embargo, las crticas ms fuertes vienen del hecho que la aproximacin de pruebas de hiptesis, ampliamente usada en muchos casos requeridos por ley o reglamentacin, obligan una hiptesis a ser 'favorecida' (la hiptesis nula), y puede tambin exagerar la importancia de pequeas diferencias en estudios grandes. Una diferencia que es altamente significativa puede ser de ninguna significancia prctica. Vase tambin crticas de prueba de hiptesis y controversia de la hiptesis nula. En los campos de la psicologa y la medicina, especialmente con respecto a la aprobacin de nuevos medicamentos por la Food and DrugAdministration, crticas de la aproximacin de prueba de hiptesis se han incrementado en los aos recientes. Una respuesta ha sido un gran nfasis en el p-valor en vez de simplemente reportar si la hiptesis fue rechazada al nivel de significancia dado. De nuevo, sin embargo, esto resume la evidencia para un efecto pero no el tamao del efecto. Una posibilidad es reportar intervalos de confianza, puesto que estos indican el tamao del efecto y la incertidumbre. Esto ayuda a interpretar los resultados, como el intervalo de confianza para un dado indicando simultneamente la significancia estadstica y el efecto de tamao. El p valor y los intervalos de confianza son basados en los mismos clculos fundamentales como aquellos para las correspondientes pruebas de hiptesis. Los resultados son presentados en un formato ms detallado, en lugar del si-o-no de las pruebas de hiptesis y con la misma metodologa estadstica. Otro tipo de aproximacin es el uso de mtodos bayesianos. Esta aproximacin ha sido, sin embargo, tambin criticada. El fuerte deseo de que los medicamentos buenos sean aprobados y que los medicamentos peligrosos o de poco uso sean rechazados crea tensiones y conflictos (errores tipo I y II en el lenguaje de pruebas de hiptesis).

Conceptos Bsicos: Estadstica: La estadstica es comnmente considerada como una coleccin de hechos numricos expresados en trminos de una relacin sumisa, y que han sido recopilado a partir de otros datos numricos. Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadstica como un valor resumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimacin de parmetro de determinada poblacin; es decir, una funcin de valores de muestra. "La estadstica es una tcnica especial apta para el estudio cuantitativo de los fenmenos de masa o colectivo, cuya mediacin requiere una masa de observaciones de otros fenmenos ms simples llamados individuales o particulares". (Gini, 1953. Murria R. Spiegel, (1991) dice: "La estadstica estudia los mtodos cientficos para recoger, organizar, resumir y analizar datos, as como para sacar conclusiones vlidas y tomar decisiones razonables basadas en tal anlisis. "La estadstica es la ciencia que trata de la recoleccin, clasificacin y presentacin de los hechos sujetos a una apreciacin numrica como base a la explicacin, descripcin y comparacin de los fenmenos". (Yale y Kendal, 1954). Cualquiera sea el punto de vista, lo fundamental es la importancia cientfica que tiene la estadstica, debido al gran campo de aplicacin que posee. Poblacin: El concepto de poblacin en estadstica va ms all de lo que comnmente se conoce como tal. Una poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan caractersticas comunes. "Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levin&Rubin (1996). "Una poblacin es un conjunto de elementos que presentan una caracterstica comn". Cadenas (1974). Ejemplo: Los miembros del Colegio de Ingenieros del Estado Cojedes. El tamao que tiene una poblacin es un factor de suma importancia en el proceso de investigacin estadstica, y este tamao vienen dado por el nmero de elementos que constituyen la poblacin, segn el nmero de elementos la poblacin puede ser finita o infinita. Cuando el nmero de elementos que integra la poblacin es muy grande, se puede considerar a esta como

una poblacin infinita, por ejemplo; el conjunto de todos los nmeros positivos. Una poblacin finita es aquella que est formada por un limitado nmero de elementos, por ejemplo; el nmero de estudiante del Ncleo San Carlos de la Universidad Nacional Experimental Simn Rodrguez. Cuando la poblacin es muy grande, es obvio que la observacin de todos los elementos se dificulte en cuanto al trabajo, tiempo y costos necesario para hacerlo. Para solucionar este inconveniente se utiliza una muestra estadstica. Es a menudo imposible o poco prctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado poblacin o universo, se examina una pequea parte del grupo llamada muestra. Muestra: "Se llama muestra a una parte de la poblacin a estudiar que sirve para representarla". Murria R. Spiegel (1991). "Una muestra es una coleccin de algunos elementos de la poblacin, pero no de todos". Levin&Rubin (1996). "Una muestra debe ser definida en base de la poblacin determinada, y las conclusiones que se obtengan de dicha muestra solo podrn referirse a la poblacin en referencia", Cadenas (1974). Ejemplo; El estudio realizado a 50 miembros del Colegio de Ingenieros del Estado Cojedes. El estudio de muestras es ms sencillo que el estudio de la poblacin completa; cuesta menos y lleva menos tiempo. Por ltimo se aprobado que el examen de una poblacin entera todava permite la aceptacin de elementos defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel de calidad. Una muestra representativa contiene las caractersticas relevantes de la poblacin en las mismas proporciones que estn incluidas en tal poblacin. Los expertos en estadstica recogen datos de una muestra. Utilizan esta informacin para hacer referencias sobre la poblacin que est representada por la muestra. En consecuencia muestra y poblacin son conceptos relativos. Una poblacin es un todo y una muestra es una fraccin o segmento de ese todo. Muestreo: Esto no es ms que el procedimiento empleado para obtener una o ms muestras de una poblacin; el muestreo es una tcnica que sirve para obtener una o ms muestras de poblacin. Este se realiza una vez que se ha establecido un marco muestral representativo de la poblacin, se procede a la seleccin de los elementos de la muestra aunque hay muchos diseos de la muestra.

Al tomar varias muestras de una poblacin, las estadsticas que calculamos para cada muestra no necesariamente seran iguales, y lo ms probable es que variaran de una muestra a otra. Ejemplo; Consideremos como una poblacin a los estudiantes de educacin del Ncleo San Carlos de la UNESR, determinando por lo menos dos caracteres ser estudiados en dicha poblacin; Religin de los estudiantes Sexo. Tipos de muestreo Existen dos mtodos para seleccionar muestras de poblaciones; el muestreo no aleatorio o de juicio y el muestreo aleatorio o de probabilidad. En este ltimo todos los elementos de la poblacin tienen la oportunidad de ser escogidos en la muestra. Una muestra seleccionada por muestreo de juicio se basa en la experiencia de alguien con la poblacin. Algunas veces una muestra de juicio se usa como gua o muestra tentativa para decidir como tomar una muestra aleatoria ms adelante. Las muestras de juicio evitan el anlisis estadstico necesarios para hacer muestras de probabilidad. Variables y Atributos: Las variables, tambin suelen ser llamados caracteres cuantitativos, son aquellos que pueden ser expresados mediante nmeros. Son caracteres susceptibles de medicin. Como por ejemplo, la estatura, el peso, el salario, la edad, etc. Segn, Murray R. Spiegel, (1992) "una variable es un smbolo, tal como X, Y, Hx, que puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio de la variable. Si la variable puede tomar solamente un valor, se llama constante." Todos los elementos de la poblacin poseen los mismos tipos de caracteres, pero como estos en general no suelen representarse con la misma intensidad, es obvio que las variables toman distintos valores. Por lo tanto estos distintos nmeros o medidas que toman los caracteres son los "valores de la variable". Todos ellos juntos constituyen una variable. Los atributos tambin llamados caracteres cualitativos, son aquellos que no son susceptibles de medicin, es decir que no se pueden expresar mediante un nmero. IUTIN (1997). "Reciben el nombre de variables cualitativas o atributos, aquellas caractersticas que pueden presentarse en individuos que constituyen un conjunto. La forma de expresar los atributos es mediante palabras, por ejemplo; profesin, estado civil, sexo, nacionalidad, etc. Puede notar que los atributos no se presentan en la misma forma en todos

los elementos. Estas distintas formas en que se presentan los atributos reciben el nombre de "modalidades". Ejemplo; El estado civil de cada uno de los estudiantes del curso de estadsticas I, no se presenta en la misma modalidad en todos. Formas de Observar la Poblacin: Atendiendo a la fuente se clasifican en directa o indirecta. Observacin directa: es aquella donde se tienen un contacto directo con los elementos o caracteres en los cuales se presenta el fenmeno que se pretende investigar, y los resultados obtenidos se consideran datos estadsticos originales. Para Ernesto Rivas Gonzlez (1997) "Investigacin directa, es aquella en que el investigador observa directamente los casos o individuos en los cuales se produce el fenmeno, entrando en contacto con ellos; sus resultados se consideran datos estadsticos originales, por esto se llama tambin a esta investigacin primaria". Ejemplo; el seguimiento de la poblacin agrcola por ao, llevado en una determinada granja. Observacin Indirecta: es aquella donde la persona que investiga hace uso de datos estadsticos ya conocidos en una investigacin anterior, o de datos observados por un tercero (persona o entidad). Con el fin de deducir otros hechos o fenmenos. Ejemplo; si un investigador pretende estudiar la produccin por aos de una granja avcola, en sus ltimos cinco aos de produccin, tendra que hacer un seguimiento, a tal fin recurrira a las observaciones que posee la oficina administrativa de la granja durante estos cinco aos, o dirigirse a la oficina de estadstica, llevada en el ministerio de produccin y comercio (M.P.C) de la localidad donde est registrada dicha granja. Es de notar que el investigador se vale de observaciones realizadas por terceros. Atendiendo a la periodicidad, puede ser continua, peridica o circunstancial. Una observacin continua; como su nombre lo indica es aquella que se lleva acabo de un modo permanente. Ejemplo: la contabilidad comercial, llevada en cuanto a compras, ventas y otras operaciones que se van registrando a medida que van producindose. Una observacin peridica; es aqulla que se lleva a cabo a travs de perodos de tiempo constantes. Estos perodos de tiempos pueden ser semanas, trimestres, semestres, aos, etc. Lo que debemos destacar es que los perodos de tiempo tomados como unidad deben tomarse constantes en los posible.

Ejemplo; el registro llevado por la Oficinas de Control de Estudios de la UNESR, en cuanto a la inscripcin de los estudiantes por semestre. La observacin circunstancial, es aquella que se efecta en forma ocasional o espordica, esta observacin hecha ms por una necesidad momentnea, que de carcter regular o permanente. Ejemplo; la obtencin de nmeros de aulas utilizadas y no utilizadas en los colegios pertenecientes al municipio San Carlos del Estado Cojedes. Atendiendo a la cobertura; pueden ser exhaustiva, parcial o mixta Observacin Exhaustiva. Cuando la observacin es efectuada sobre la totalidad de los elementos de la poblacin se habla de una observacin exhaustiva. Observacin Parcial. Dados que las poblaciones en general son grandes, la observacin de todos sus elementos se ve imposibilitada. La solucin para superar este inconveniente es observar una parte de esta poblacin. Observacin Mixta. En este tipo de observacin se combinan adecuadamente la observacin exhaustiva con la observacin parcial. Por lo general, este tipo de observaciones se lleva a cabo de tal manera que los caracteres que se consideran bsicos se observan exhaustivamente y los otros mediante una muestra; o bien cuando la poblacin es muy grande, parte de ella se observa parcialmente. Censo: Se entiende por censo aquella numeracin que se efecta a todos y cada uno de los caracteres componentes de una poblacin. Para Levin&Rubin (1996) "Algunas veces es posible y prctico examinar a cada persona o elemento de la poblacin que deseamos describir. A esto lo llamamos una numeracin completa o censo. Utilizamos el muestre cuando no es posible contar o medir todos los elementos de la poblacin. Si es posible listar (o enumerar) y observar cada elemento de la poblacin, los censos se utilizan rara vez porque a menudo su compilacin es bastante difcil, consume mucho tiempo por lo que resulta demasiado costoso. Encuesta: Se entiende por encuesta las observaciones realizadas por muestreo, es decir son observaciones parciales. El diseo de encuestas es exclusivo de las ciencias sociales y parte de la premisa de que si queremos conocer algo sobre el comportamiento de las personas, lo mejor, ms directo y simple es preguntrselo directamente a ellas. (Cadenas, 1974).

Segn Antonio Napolitano "La encuesta, es un mtodo mediante el cual se quiere averiguar. Se efecta a travs de cuestionarios verbales o escritos que son aplicados a un gran nmero de personas". Estadstica Descriptiva: Tienen por objeto fundamental describir y analizar las caractersticas de un conjunto de datos, obtenindose de esa manera conclusiones sobre las caractersticas de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo referirse a la observacin de todos los elementos de una poblacin (observacin exhaustiva) sino tambin a la descripcin de los elementos de una muestra (observacin parcial). En relacin a la estadstica descriptiva, Ernesto Rivas Gonzles dice; "Para el estudio de estas muestras, la estadstica descriptiva nos provee de todos sus medidas; medidas que cuando quieran ser aplicadas al universo total, no tendrn la misma exactitud que tienen para la muestra, es decir al estimarse para el universo vendr dada con cierto margen de error; esto significa que el valor de la medida calculada para la muestra, en el oscilar dentro de cierto lmite de confianza, que casi siempre es de un 95 a 99% de los casos. Estadstica Inductiva: Est fundamentada en los resultados obtenidos del anlisis de una muestra de poblacin, con el fin de inducir o inferir el comportamiento o caracterstica de la poblacin, de donde procede, por lo que recibe tambin el nombre de Inferencia estadstica. Segn Berenson y Levine; Estadstica Inferencial son procedimientos estadsticos que sirven para deducir o inferir algo acerca de un conjunto de datos numricos (poblacin), seleccionando un grupo menor de ellos (muestra). El objetivo de la inferencia en investigacin cientfica y tecnolgica radica en conocer clases numerosas de objetos, personas o eventos a partir de otras relativamente pequeas compuestas por los mismos elementos. En relacin a la estadstica descriptiva y la inferencial, Levin&Rubin (1996) citan los siguientes ejemplos para ayudar a entender la diferencia entre las dos. Supngase que un profesor calcula la calificacin promedio de un grupo de historia. Como la estadstica describe el desempeo del grupo pero no hace ninguna generalizacin acerca de los diferentes grupos, podemos decir que el profesor est utilizando estadstica descriptiva. Graficas, tablas y diagramas que muestran los datos de manera que sea ms fcil su entendimiento son ejemplos de estadstica descriptiva. Supngase ahora que el profesor de historia decide utilizar el promedio de calificaciones obtenidos por uno de sus grupos para estimar la calificacin promedio de las diez unidades del

mismo curso de historia. El proceso de estimacin de tal promedio sera un problema concerniente a la estadstica inferencial. Los estadsticos se refieren a esta rama como inferencia estadstica, esta implica generalizaciones y afirmaciones con respecto a la probabilidad de su validez. UNIDAD II Medicin de Caracteres Medicin Existen diversas definiciones del termino "medicin", pero estas dependen de los diferentes puntos de vista que se puedan tener al abordar el problema de la cuantificacin y el proceso mismo de la construccin de una escala o instrumento de medicin. En general, se entiende por medicin la asignacin de nmeros a elementos u objetos para representar o cuantificar una propiedad. El problema bsico est dado por la asignacin un numeral que represente la magnitud de la caracterstica que queremos medir y que dicho nmeros pueden analizarse por manipulaciones de acuerdo a ciertas reglas. Por medio de la medicin, los atributos de nuestras percepciones se transforman en entidades conocidas y manejables llamadas "nmeros". Es evidente que el mundo resultara catico si no pudiramos medir nada. En este caso cabra preguntarse de que le servira la fsico saber que el hierro tiene una alta temperatura de fusin. Niveles o Escalas de mediciones Escala Nominal: La escala de medida nominal, puede considerarse la escala de nivel ms bajo, y consiste en la asignacin, puramente arbitraria de nmeros o smbolos a cada una de las diferentes categoras en las cuales podemos dividir el carcter que observamos, sin que puedan establecerse relaciones entre dichas categoras, a no ser el de que cada elemento pueda pertenecer a una y solo una de estas categoras. Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma sean equivalentes respecto del atributo o propiedad en estudio, despus de lo cual se asignan nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones, se le atribuyan nmeros, puede ser una de las razones por las cuales se le conoce como "medidas nominales". Por ejemplo, podemos estar interesados en clasificar los estudiantes de la UNESR Ncleo San Carlos de acuerdos a la carrera que cursan. Carrera Nmero asignada a la categora

Educacin Administracin

1 2

Se ha de tener presente que los nmeros asignados a cada categora sirven nica y exclusivamente par identificar la categora y no poseen propiedades cuantitativas. Escala Ordinal: En caso de que puedan detectarse diversos grados de un atributo o propiedad de un objeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse a la propiedad de "orden" de los nmeros asignndolo a los objetos en estudio de modo que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse que A posee un mayor grado de atributo que B. La asignacin de nmeros a las distintas categoras no puede ser completamente arbitraria, debe hacerse atendiendo al orden existente entre stas. Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo de poder ordenar todas sus categoras, el clculo de las medidas estadsticas de posicin, como por ejemplo la mediana. Ejemplo: Al asignar un nmero a los pacientes de una consulta mdica, segn el orden de llegada, estamos llevando una escala ordinal, es decir que al primero en llegar ordinal, es decir que al primeo en llegar le asignamos el n 1, al siguiente el n 2 y as sucesivamente, de esta forma, cada nmero representar una categora en general, con un solo elemento y se puede establecer relaciones entre ellas, ya que los nmeros asignados guardan la misma relacin que el orden de llegada a la consulta. Escalas de intervalos iguales: la escala de intervalos iguales, est caracterizada por una unidad de medida comn y constante que asigna un nmero igual al nmero de unidades equivalentes a la de la magnitud que posea el elemento observado. Es importante destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no refleja en ningn momento ausencia de la magnitud que estamos midiendo. Esta escala, adems de poseer las caractersticas de la escala ordinal, encontramos que la asignacin de los nmeros a los elemento es tan precisa que podemos determinar la magnitud de los intervalos (distancia) entre todos los elementos de la escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera escala verdaderamente cuantitativa y a los caracteres que posean esta escala de medida pueden calculrsele todas las medidas estadsticas a excepcin del coeficiente de variacin. Ejemplo:

El lapso transcurrido entre 1998-1999 es igual al que transcurri entre 2000-2001. Escala de coeficientes o Razones: El nivel de medida ms elevado es el de cocientes o razones, y se diferencia de las escalas de intervalos iguales nicamente por poseer un punto cero propio como origen; es decir que el valor cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se observa una carencia total de propiedad, se dispone de una unidad de medida para el efecto. A iguales diferencias entre los nmeros asignados corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio. Adems, siendo que cero ya no es arbitrario, sino un valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la magnitud de la propiedad presente en B. Ejemplo: En una encuesta realizada en un barrio de esta localidad se observ que hay familias que no tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que tienen 3 hijos. Las variables y su medicin: Una variable es un smbolo, tal como X, Y, H, x B, que pueden tomar un conjunto prefijado de valores, llamado dominio de esa variable. Para Murray R. Spiegel (1991) "una variable que puede tomar cualquier valor entre dos valores dados se dice que es una variable continua en caso contrario diremos que la variable es discreta". Las variables, tambin llamadas caracteres cuantitativos, son aquellas cuyas variaciones son susceptibles de ser medidas cuantitativamente, es decir, que pueden expresar numricamente la magnitud de dichas variaciones. Por intuicin y por experiencia sabemos que pueden distinguirse dos tipos de variables; las continuas y las discretas Las variables continuas se caracterizan por el hecho de que para todo para de valores siempre se puede encontrar en valor intermedio, (el peso, la estatura, el tiempo empleado para realizar un trabajo, etc.) Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos valores consecutivos. Por ejemplo, la estatura, el peso, la temperatura. Para ver el grfico seleccione la opcin "Descargar" del men superior Ejemplo: En el preescolar Blanca de Prez, ubicado en la urbanizacin Monseor Padilla de esta ciudad se procedi a recoger las medidas de talla y peso de los nios que a este asisten. Nio Peso Talla Jos 18,300 1,15

Julio 20,500 1,20 Pedro 19,000 1,10 Luis 18,750 1,18 .Las variables discretas sern aquellas que pueden tomar solo un nmero limitado de valores separados y no continuos; son aquellas que solo toman un determinado nmeros de valores, porque entre dos valores consecutivos no pueden tomar ningn otro; por ejemplo el nmero de estudiantes de una clase es una variable discreta ya que solo tomar los valores 1, 2, 3, 4... ntese que no encontramos valor como 1,5 estudiantes UNIDAD III Estadsticas Primarias Datos Estadsticos: Los datos estadsticos no son otra cosa que el producto de las observaciones efectuadas en las personas y objetos en los cuales se produce el fenmeno que queremos estudiar. Dicho en otras palabras, son los antecedentes (en cifras) necesarios para llegar al conocimiento de un hecho o para reducir las consecuencias de este. Los datos estadsticos se pueden encontrar de forma no ordenada, por lo que es muy difcil en general, obtener conclusiones de los datos presentados de esta manera. Para poder obtener una precisa y rpida informacin con propsitos de descripcin o anlisis, estos deben organizarse de una manera sistemtica; es decir, se requiere que los datos sean clasificados. Esta clasificacin u organizacin puede muy bien hacerse antes de la recopilacin de los datos. Ejemplo: Si se quiere conocer las caractersticas de los estudiantes del Ncleo San Carlos de la UNESR, que solicitan prstamo a la biblioteca de dicha Universidad, la recoleccin de la informacin debe clasificar a cada estudiante sobre la base de: Carrera que estudia, edad, semestre de estudios, etc. Vemos pues que la clasificacin marca la pauta de la clase de datos que debe ser obtenido. Clasificacin de los datos Los datos estadsticos pueden ser clasificados en cualitativos, cuantitativos, cronolgicos y geogrficos. Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de clase y no de cantidad. Ejemplo:

Si deseamos clasificar los estudiantes que cursan la materia de estadstica I por su estado civil, observamos que pueden existir solteros, casados, divorciados, viudos. Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes, decimos que son datos cuantitativos. Ejemplo: Se clasifican los estudiantes del Ncleo San Carlos de la UNESR de acuerdo a sus notas, observamos que los valores (nota) representan diferentes magnitudes. Datos cronolgicos: cuando los valores de los datos varan en diferentes instantes o perodos de tiempo, los datos son reconocidos como cronolgicos. Ejemplo: Al registrar los promedios de notas de los Alumnos del Ncleo San Carlos de la UNESR en los diferentes semestres. Datos geogrficos: cuando los datos estn referidos a una localidad geogrfica se dicen que son datos geogrficos. Ejemplo El nmero de estudiantes de educacin superior en las distintas regiones del pas. Fuentes de datos Estadsticos: Los datos estadsticos necesarios para la comprensin de los hechos pueden obtenerse a travs de fuentes primarias y fuentes secundarias. Fuentes de datos primarias: es la persona o institucin que ha recolectado directamente los datos. Fuentes secundarias: son las publicaciones y trabajos hechos por personas o entidades que no han recolectado directamente la informacin. Las fuentes primarias ms confiables, son las efectuadas por oficinas gubernamentales encargadas de tal fin. En la prctica, es aconsejable utilizar fuentes de datos primarias y en ltima instancia cuando estas no existan, usar estadsticas de fuentes secundarias. Con este ltimo tipo no debemos pasar por alto que la calidad de las conclusiones estadsticas dependen en grado sumo de la exactitud de los datos que se recaben. De anda servira usar tcnicas estadsticas precisas y refinadas para llegar a conclusiones valederas, si estas tcnicas no son aplicadas a datos adecuados o confiables. Cuando un investigador quiere obtener datos estadsticos relativo a un estudio que desea efectuar, puede elegir entre una fuente primaria o en su defecto, una secundaria. O recopilar los

datos por s mismo. La posibilidad mencionada en ltimo termino podr deberse bien a la inexistencia de los datos o bien a que esto no se encuentran discriminados en la forma requerida. Ejemplo: Si un investigador quiere conocer el nmero de alumnos repitientes en educacin media, clasificados por ciclos, para los ltimos diez aos, el investigador puede usar una fuente primaria, tal como la memoria y cuenta el Ministerio de Educacin cada ao. Mtodo para la recoleccin de datos: En estadstica se emplean una variedad de mtodos distintos para obtener informacin de los que se desea investigar. Discutiremos aqu los mtodos ms importantes, incluyendo las ventajas y limitaciones de estos. La entrevistapersonal: los datos estadsticos necesarios para una investigacin, se renen frecuentemente mediante un proceso que consiste en enviar un entrevistador o agente, directamente a la persona investigada. El investigador efectuar a esta persona una serie de preguntas previamente escritas en un cuestionario o boleta, donde anotar las respuestas correspondientes. Este procedimiento que se conoce con el nombre de entrevista personal, permite obtener una informacin ms veraz y completa que la que proporcionan otros mtodos, debido a que al tener contacto directo con la persona entrevistada, el entrevistador podr aclarar cualquier duda que se presente sobre el cuestionario o investigacin. Otra ventaja es la posibilidad que tienen los entrevistadores de adaptar el lenguaje de las preguntas al nivel intelectual de las personas entrevistadas. Una de las desventajas de este mtodo se debe a que si el entrevistador no obra de buena f o no tiene un entrenamiento adecuado, puede alterar las respuestas por las personas entrevistadas. Otra desventaja es su alto costo, ya que resulta bastante oneroso el entrenamiento de los agentes o entrenadores y los supervisores de estos, sobre todo si se trata de una investigacin extensa. Cuestionarios por correo: consiste en enviar por correo el cuestionario acompaado por el instructivo necesario, dando en este no solo las instrucciones pertinentes para cada una de las preguntas, sino tambin una breve explicacin del objeto de la encuesta con el fin de evitar interpretaciones errneas. Una de las ventajas es que tienen un costo muy inferior al anterior procedimiento, puesto que no hay que incluir gastos de entrenamiento de personal, el nico gasto sera el de franqueo postal. Dentro de las desventajas de este procedimiento podemos sealar que solo un porcentaje bastante bajo de estos es devuelto, en algunos casos no estamos seguros de que los formularios hayan sido recibidos por sus destinatarios y que hayan sido respondido por ellos mismos. Lo que trae como consecuencia que la informacin se obtenga con una serie de errores difciles de precisar por el investigador.

Entrevista por telfono: como lo indica su nombre, este mtodo consiste en telefonear a la persona a entrevistar y hacerle una serie de preguntas. Este mtodo es bastante simple y econmico, ya que el entrenamiento y supervisin de las personas encargadas de efectuar las preguntas es siempre fcil. Entre las limitaciones que presenta este mtodo podemos sealar el nmero de preguntas que pueden formularse es relativamente limitado; adems las investigaciones efectuadas por este mtodo tienen un carcter selectivo, debido a que muchas de las personas que potencialmente podran ser investigadas no posee servicio telefnico, por lo que quedan sin la posibilidad de ser entrevistados. Instrumentos para la recoleccin de datos: Cuestionarios: Cualquiera que sea el mtodo por el que se decida el investigador para recabar informacin, es necesario elaborar un estudio de preguntas. Los cuestionarios en general, constan de las siguientes partes: La identificacin del cuestionario: nombre del patrocinante de la encuesta, (oficial o privada), nombre de la encuesta, nmero del cuestionario, nombre del encuestador, lugar y fecha de la entrevista. Datos de identificacin y de carcter social del encuestado: apellidos, nombres, cdula de identidad, nacionalidad, sexo, edad o fecha de nacimiento, estado civil, grado de instruccin, ocupacin actual, ingresos, etc. Datos propios de la investigacin, son los datos que interesa conocer para construir el propsito de la investigacin. Como es natural, estas partes, as como las preguntas, varan de acuerdo a la finalidad de la encuesta. En algunos tipos de investigacin, la parte referente a los datos personales es eliminada por no tener ningn tipo de inters para el estudio. Consideraciones que debemos tomar en cuenta: El cuestionario debe ser conciso; tratar en los posible de que con el menor nmero de preguntas, se obtenga la mejor informacin. Claridad de la redaccin; evitar preguntas ambiguas o que sugieran respuestas incorrectas, por lo que deben estar formuladas las preguntas de la forma ms sencilla. Discrecin: un cuestionario hecho a conciencia, no debe tener preguntas indiscretas o curiosas, sobre datos personales que puedan ofender al entrevistado.

Facilidad de contestacin: se deben evitar, en lo posible, las preguntas de respuestas libres o abiertas y tambin la formulacin de preguntas que requieran clculos numricos por parte del entrevistado. Orden de las preguntas: estas deben tener una secuencia y un orden lgico, agruparlas procurando que se relacionen unas con otras. Series o distribuciones estadsticas: Anteriormente hemos sealado que la estadstica, no se encarga del estudio de un hecho aislado, sino que tienen por objeto de los colectivos. Pues bien cuando se realiza una investigacin se obtiene una masa de datos que deben ser organizados para disponerlos en un orden, arreglo o secuencia lgica, con el fin de facilitar el anlisis de los mismos esta coleccin de datos numricos obtenidos de la observacin, que se clasifican y ordenan segn un determinado criterio, se denominan "series estadsticas", tambin conocidas como "distribucin estadstica". Clasificacin de las series estadsticas: Ejemplo: Produccin nacional de madera en Rola en m Rollizos (periodo 1993 1998) Aos 1993 1994 1995 1996 1997 1998 Produccin (m rollizos) 1.161.061,454 981.668,626 1.087.926,142 1.440.306,250 1.618.075,000 1.027.177,876

Fuente: MARN D.G.S Recurso Forestal. 1999 CVG PROFORCA Es importante resaltar que cuando se trata de series temporales o cronolgicas, se debe especificar el instante o el periodo de tiempo a los que se refieren los caracteres en estudio.

Cuando nos referimos a instantes de tiempo, por el hecho de que la observacin se hace en un momento especfico de tiempo. Ejemplo: Plantaciones forestales ejecutadas a nivel nacional, al 31 de diciembre de cada ao entre 1997 2001. Series temporales o cronolgicas; estas se definen como una masa o conjunto de datos producto de la observacin de un fenmeno individual o colectivo, cuantificable en sucesivos instantes o periodos de tiempo. Series atemporales; cuando las observaciones de un fenmeno se hacen referidas al mismo instante o intervalo de tiempo, nos encontramos ente una serie atemporal. Aqu el tiempo no va incluido a cada observacin, puesto que es el mismo tiempo para todas ellas. Este tipo de observacin proporciona una "visin instantnea" de los fenmenos o caracteres de los componentes del colectivo en estudio. Ejemplo: Las notas de las participantes en la materia de estadstica I en el periodo acadmico que termin en septiembre del 2001. 2.1) series de frecuencia; cuando realizamos un estudio de cada uno de los elementos que componen la poblacin o muestra bajo anlisis, observamos que en general, hay un nmero de veces en que aparece repetido un mismo valor de una variable, o bien repeticiones de la misma modalidad de un atributo. Este nmero de repeticiones de un resultado, recibe el nombre de frecuencia absoluta o simplemente frecuencia. El procedimiento mediante el cual se realiza el conteo, para as determinar el nmero de veces que cada dato se repite, recibe el nombre de tabulacin. Ejemplo: Consideremos las edades de 20 nios, pertenecientes al Preescolar Blanca de Prez, ubicado en la urbanizacin Monseor Padilla 5 6 5 4 3 6 3 4 5 4 3 4 6 5 3 4 3 6 4 6 Tabulando los datos tenemos

Nios distribuidos por edades: Edad (variable) 3 4 5 6 Total = N de nios (Frecuencia) 5 6 4 5 20

Al agrupar los resultados de las observaciones en trmino de las veces que stos se repiten, da lugar a las llamadas "series de frecuencias" o distribuciones de frecuencias; las cuales se dividen a su vez en series de frecuencia cualitativas y cuantitativas, segn que los caracteres de estudio se refieran a atributos o variables respectivamente. 2.2.1) Series de frecuencia acumulativa: son comnmente llamadas series de frecuencia de atributos o caracteres cualitativos y las formas de representar un atributo recibe el nombre de modalidades. Cuando se observan y se obtienen los elementos que deseamos estudiar con respecto a un carcter de tipo cualitativo y se procede a agruparlos segn las distintas modalidades que toma el atributo, "frecuencia cualitativa". Ejemplo: Agrupamos los resultados obtenidos al observar los 35 estudiantes de la materia estadstica I, respecto a su estado civil. Estudiantes de la materia Estadsticas I, clasificados por su estado civil. Estado civil Solteros Casados Viudos Divorciados N de Estudiantes (frecuencia) 18 12 1 4

2.1.2) Series de frecuencias cualitativas: es el resultado del agrupamiento de los valores que se repiten (frecuencia) al ser observada una variable. Ejemplo: Tomamos nuevamente los 35 estudiantes de la materia estadstica I, respecto a su edad. Edad (en aos) 19 20 25 28 32 42 Total = N de estudiantes (frecuencia) 12 2 8 6 4 3 35

2.2) series especiales o geogrficas: es aquella que est formada por los valores que toman una variable en funcin del espacio geogrfico.

Qu es estadstica, cules tipos hay, cul es su objetivo?


Clasificado en: Evaluacin de proyectos  09-2002
 LA ESTADSTICA: Es la rama de las Matemticas que se va a encargar de Recopilar, Organizar, y Procesar datos con el fin de inferir las caractersticas de la poblacin objetivo. LOS TIPOS DE ESTADSTICA. Descriptiva: Es la tcnica que se va a encargar de la recopilacin, presentacin, tratamiento y anlisis de los datos, con el objeto de resumir, describir las caractersticas de un conjunto de datos y por lo general toman forma de tablas y grficas. Inferencia Estadstica: Tcnica mediante la cual se sacan conclusiones o generalizaciones acerca de parmetros de una poblacin basndose en el estadgrafo o estadgrafos de una muestra de poblacin. OBJETIVO DE LA ESTADSTICA: Es la obtencin de conclusiones basadas en los datos experimentales. OBJETIVO DE LA ESTADSTICA DESCRIPTIVA: Describir las caractersticas principales de los datos reunidos. OBJETIVO DE LA INFERENCIA ESTADSTICA: Extraer las conclusiones tiles sobre la totalidad de todas las observaciones posibles basndose en la informacin recolectada. POBLACIN: Es el conjunto de todos los posibles elementos que intervienen en un

experimento o en un estudio. CENSO: Al estudio completo de la poblacin. TIPOS DE POBLACIN: POBLACIN FINITA: Es aquella que indica que es posible alcanzarse o sobrepasarse al contar. Es aquella que posee o incluye un nmero limitado de medidas y observaciones. POBLACIN INFINITA: Es infinita si se incluye un gran conjunto de medidas y observaciones que no pueden alcanzarse en el conteo. Son poblaciones infinitas porque hipotticamente no existe lmite en cuanto al nmero de observaciones que cada uno de ellos puede generar. MUESTRA: Un conjunto de medidas u observaciones tomadas a partir de una poblacin dada. Es un subconjunto de la poblacin. MUESTRA REPRESENTATIVA: Un subconjunto representativo seleccionado de una poblacin de la cual se obtuvo. MUESTREO: Al estudio de la muestra representativa. PARMETRO: Son las caractersticas medibles en una poblacin completa. Se le asigna un smbolo representado por una letra griega. ESTADSTICO O ESTADGRAFO: Es la medida de una caracterstica relativa a una muestra. La mayora de los estadsticos muestrales se encuentran por medio de una frmula y suelen asignrseles nombres simblicos que son letras latinas. DATOS ESTADSTICOS (VARIABLES): Los datos son agrupaciones de cualquier nmero de observaciones relacionadas. Para que se considere un dato estadstico debe tener 2 caractersticas:

a) Que sean comparables entre s. b) Que tengan alguna relacin. VARIABLE: Una caracterstica que asume valores. CLASES DE DATOS: VARIABLE CUANTITATIVA O ESCALAR: Ser una variable cuando pueda asumir sus resultados en medidas numricas. VARIABLE CUANTITATIVA DISCRETA : Es aquella que puede asumir slo ciertos valores, nmeros enteros. Ejemplo: El nmero de estudiantes (1,2,3,4) VARIABLE CUANTITATIVA CONTINUA: Es aquella que tericamente puede tomar cualquier valor en una escala de medidas, ya sea entero o fraccionario. Ejemplo : Estatura : 1.90 m VARIABLES CUALITATIVAS O NOMINALES: Cuando no es posible hacer medidas numricas, son susceptibles de clasificacin. Ejemplo: Color de autos: rojo, verde, azul. EXPERIMENTO: Es una actividad planificada, cuyos resultados producen un conjunto de datos. Es el proceso mediante el cual una observacin o medicin es registrada. Ejemplo: Cul ser la preferencia del consumidor ante dos marcas de refresco con similares caractersticas en un ambiente armnico y sin publicidad?

Estadstica La Estadstica trata del recuento, ordenacin y clasificacin de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadstico consta de las siguientes fases: Recogida de datos. Organizacin y representacin de datos. Anlisis de datos. Obtencin de conclusiones.

La Estadstica se divide en dos partes: Estadstica descriptiva LaEstadstica descriptiva registra los datos en tablas y los representa en grficos. Calcula los parmetros estadsticos (medidas de centralizacin y de dispersin), que describen el conjunto estudiado. Estadstica inferencial La Estadstica inferencial estudia cmo sacar conclusiones generales para toda la poblacin a partir del estudio de una muestra, y el grado de fiabilidad o significacin de los resultados obtenidos. Conceptos de Estadstica Poblacin Una poblacin es el conjunto de todos los elementos a los que se somete a un estudio estadstico. Individuo Un individuo o unidad estadstica es cada uno de los elementos que componen la poblacin. Muestra Una muestra es un conjunto representativo de la poblacin de referencia, el nmero de individuos de una muestra es menor que el de la poblacin. Muestreo

El muestreo es la reunin de datos que se desea estudiar, obtenidos de una proporcin reducida y representativa de la poblacin. Valor Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz. Dato Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.

Variables estadsticas Una variable estadstica es cada una de las caractersticas o cualidades que poseen los individuos de una poblacin. Variable cualitativa Las variables cualitativas se refieren a caractersticas o cualidades que no pueden ser medidas con nmeros. Podemos distinguir dos tipos: Variable cualitativa nominal Una variable cualitativa nominal presenta modalidades no numricas que no admiten un criterio de orden. Por ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo. Variable cualitativa ordinal o variable cuasicuantitativa Una variable cualitativa ordinal presenta modalidades no nmericas, en las que existe un orden. Por ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba deportiva: 1, 2, 3, ... Medallas de una prueba deportiva: oro, plata, bronce.

Variable cuantitativa

Una variable cuantitativa es la que se expresa mediante un nmero, por tanto se pueden realizar operaciones aritmticas con ella. Podemos distinguir dos tipos: Variable discreta Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores especficos. Por ejemplo: El nmero de hermanos de 5 amigos: 2, 1, 0, 1, 3. Variable continua Una variable continua es aquella que puede tomar valores comprendidos entre dos nmeros. Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la prctica medimos la altura con dos decimales, pero tambin se podra dar con tres decimales.

Distribucin de frecuencias La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente. Frecuencia absoluta La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por fi. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria.

Frecuencia relativa La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos.

Se puede expresar en tantos por ciento y se representa por ni.

La suma de las frecuencias relativas es igual a 1. Frecuencia acumulada La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fi. Frecuencia relativa acumulada La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento. Este tipo de tablas de frecuencias se utiliza con variables discretas.

Distribucin de frecuencias agrupadas La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un nmero grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Lmites de la clase Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase. Amplitud de la clase La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase. Marca de clase La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros.

Parmetros estadsticos

Un parmetro estadstico es un nmero que se obtiene a partir de los datos de una distribucin estadstica. Los parmetros estadsticos sirven para sintetizar la informacin dada por una tabla o por una grfica. Hay tres tipos parmetros estadsticos: De centralizacin. De posicin. De dispersin.

Medidas de centralizacin Nos indican en torno a qu valor (centro) se distribuyen los datos. Lamedidas de centralizacin son: Media aritmtica La media aritmtica es el valor promedio de la distribucin. Mediana La mediana es la puntacin de la escala que separa la mitad superior de la distribucin y la inferior, es decir divide la serie de datos en dos partes iguales. Moda La moda es el valor que ms se repite en una distribucin.

Medidas de posicin Las medidas de posicin dividen un conjunto de datos en grupos con el mismo nmero de individuos. Para calcular las medidas de posicin es necesario que los datos estn ordenados de menor a mayor. Lamedidas de posicin son:

Cuartiles Los cuartiles dividen la serie de datos en cuatro partes iguales. Deciles Los deciles dividen la serie de datos en diez partes iguales. Percentiles Los percentiles dividen la serie de datos en cien partes iguales.

Medidas de dispersin Las medidas de dispersin nos informan sobre cunto se alejan del centro los valores de la distribucin. Las medidas de dispersin son: Rango o recorrido El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica. Desviacin media La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media. Varianza La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media. Desviacin tpica La desviacin tpica es la raz cuadrada de la varianza.

Grficos Estadsticos
Share

El grfico es la representacin en el plano, de la informacin estadstica, con el fin de obtener una impresin visual global del material presentado, que facilite su rpida comprensin. Los grficos son una alternativa a las tablas, para representar las distribuciones de frecuencias.

Algunos requisitos recomendables al construir un grfico son:

y y y

Sencillez y autoexplicacin. Evitar distorsiones por escala exageradas. Eleccin adecuada del tipo de grfico, segn los objetivos y nivel de medicin de las variables.

Tipos de grficos

1. Grfico de Barras: Se usan para representar la distribucin de frecuencias de variables discretas. Cada categora se representa por una barra cuyo largo indica la frecuencia de observaciones de dicha categora.

2. Grfico de barras divididas: Se utilizan para estudiar la distribucin de frecuencias de una variable discreta (con pocas categoras) dentro de diferentes niveles de otra variable discreta.

3. Grficos de Torta

Es una alternativa equivalente a los grficos de barras divididas, este tipo de grfico muestra la particin de un total en sus partes componentes. Para su construccin se considera que al circulo, o sea a los 360 le corresponde el 100% de los casos, en consecuencia conviene considerar lo siguiente:

y y y

Expresar cada cantidad parcial en su frecuencia relativa o porcentual. Expresar la frecuencia relativa o porcentual en grados. Dibujar los ngulos correspondientes.

4. Pictogramas

Son una forma de representar la informacin mediante dibujos de los objetos que son motivo de estudio, con un formato tal que de una idea rpida, visual, de la distribucin de frecuencia. Son tiles para fines publicitarios por ser atractivos y de fcil interpretacin.

5. Grfico de Rangos

En este tipo de grficos la extensin mxima y mnima de las barras indica los rangos superior e inferior de validez de los datos considerados. En ocasiones se designan valores internos al rango, aparte del mximo y el mnimo, con una lnea que cruza la barra, que puede corresponder a conceptos estadsticos con la media, la moda y mediana.

6. Grfico de barras agrupado.

Se usan para mostrar la posible asociacin entre dos o mas variables discretas (nominal u ordinal). Se dibujan barras en grupos que corresponden a subdivisiones de una clasificacin ms general.

7. Histograma

Este grfico es especialmente adecuado para representar frecuencias en el caso de variables de intervalo o razn continuas (Para ver distribucin de variables). Consiste en una serie de barras adyacentes cuyas superficies son proporcionales a la frecuencia del intervalo sobre el cual se levantan. Si los intervalos son de igual amplituf, los rctangulos son de altura proporcional a la frecuencia correspondiente.

8. Diagrama de Dispersin.

Se utilizan cuando se estudia la posible asociacin entre dos variables de nivel de intervalos o de razn, puede ser de gran utilidad representar las observaciones en coordenadas cartesianas. Se obtiene de esta manera una nube de puntos en el plano, denominado diagrama de dispersion o grfico de correlacin.

Potrebbero piacerti anche