Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Conceptos
Si bien no hay una definicin de estadstica exacta, se puede decir que la "estadstica es el estudio de
los mtodos y procedimientos para recoger, clasificar, resumir y analizar datos y para hacer inferencias
cientficas partiendo de tales datos".
Esta definicin cubre gran parte de la actividad del cientfico. Es importante observar que el objeto del que
realiza el anlisis estadstico son los datos y las observaciones cientficas por s mismos, mas que el material
qumico que interviene en el estudio.
Por lo tanto no es posible trazar lmites rgidos entre la qumica, la estadstica y la matemtica.
El campo de la estadstica descriptiva no tiene que ver con las implicaciones o conclusiones que se puedan
deducir de conjuntos de datos. La estadstica descriptiva sirve como mtodo para organizar datos y poner de
manifiesto sus caractersticas esenciales con el propsito de llegar a conclusiones.
La inferencia estadstica se basa en las conclusiones a la que se llega por la ciencia experimental basndose
en informacin incompleta.
Por ejemplo, Mendel al estudiar la manera como diferan entre s las plantas de guisantes en altura, color de
las semillas, color de las vainas y color de las flores, tuvo que hacer sus conclusiones necesariamente
basndose en un grupo de plantas relativamente poco numeroso comparado con toda la poblacin de plantas
de guisantes de un tipo particular.
Al hacer un enunciado, como por ejemplo, sobre el color de las flores, las conclusiones de Mendel dependan
de la muestra particular de plantas disponibles para este estudio.
En la terminologa estadstica, el procedimiento inductivo implica el hacer inferencias acerca de una poblacin
adecuada universo a la luz de lo averiguado en un subconjunto aparte o muestra.
La inferencia estadstica se refiere a los procedimientos mediante los cuales se pueden hacer tales
generalizaciones inducciones.
Es importante por todo lo dicho anteriormente, que el proceso de la inferencia cientfica, implica el grado mas
elevado de cooperacin entre la estadstica y el estudio experimental.
Grficos y tablas
Principios generales
Los grficos se han de explicar enteramente por s mismos. El contenido de un grfico deber ser tan
completo como sea posible.
Las escalas vertical y horizontal estarn rotuladas con claridad dando las unidades pertinentes. La mayoras
de los grficos presentan informacin numrica con escalas, que deben rotularse para describir
completamente la variable presentada en la escala y para variables de medida se dirn las unidades
de medicin.
No se debe tratar de abarcar demasiada informacin en un solo grfico. Es mejor hacer varios grficos que
comprimir toda la informacin en uno solo. Una regla prctica segura es evitar grficos que contengan ms de
3 curvas.
Los grficos tienen que dar una visin general y no una imagen detallada de un conjunto de datos. Las
presentaciones detalladas se deben reservar para las tablas.
Las tablas se explicarn por s mismas enteramente. como los grficos, se ha de dar suficiente informacin en
el ttulo y en los encabezamientos de columnas y filas de la tabla para permitir que el lector identifique
fcilmente su contenido.
Como el ttulo ser por lo general lo primero que se lee en detalle, deber suministrar toda la informacin
esencial sobre el contenido de la tabla y deber especificar el tiempo, lugar, material estudio experimental y
relaciones que se presenten en la tabla.
Los nmeros que indican valores de la misma caracterstica se han de dar con el mismo nmero de
decimales.
Estadstica descriptiva
Al describir grupos de observaciones, con frecuencia se desea describir el grupo con un solo nmero. Para tal
fin, desde luego, no se usar el valor mas elevado ni el valor mas pequeo como nico representante, ya que
solo representan los extremos. mas bien que valores tpicos. Entonces sera mas adecuado buscar un valor
central.
Las medidas que describen un valor tpico en un grupo de observaciones suelen llamarse medidas de
tendencia central..Es importante tener en cuenta que estas medidas se aplican a grupos mas bien que a
individuos. un promedio es una caracterstica de grupo, no individual.
Media aritmtica
La medida de tendencia central mas obvia que se puede elegir, es el simple promedio de las observaciones
del grupo, es decir el valor obtenido sumando las observaciones y dividiendo esta suma por el nmero de
observaciones que hay en el grupo.
En realidad hay muchas clases de promedios y sta se la llama media aritmtica para denotar la suma de un
grupo de observaciones dividida por su nmero.
Mediana
Otra medida de tendencia central que se utiliza con mucha frecuencia es la mediana, que es el valor situado
en medio en un conjunto de observaciones ordenadas por magnitud.
Moda
Otra medida de tendencia central es la moda. La moda es el valor que ocurre con mas frecuencia en un
conjunto de observaciones.
Centro de amplitud
Media geomtrica
Media armnica
Media ponderada
En ciertas circunstancias no todas las observaciones tienen igual peso. En general si se tienen observaciones
con sus respectivos pesos es:
Medidas de variabilidad
Amplitud
Se obtiene restando el valor mas bajo del mas alto en un conjunto de observaciones. La amplitud tiene la
ventaja de que es fcil de calcular y sus unidades son las mismas que las de la variable que se mide. La
amplitud no toma en consideracin el nmero de observaciones de la muestra estadstica, sino solamente la
observacin del valor mximo y la del valor mnimo. Sera deseable utilizar tambin los valores intermedios del
conjunto de observaciones.
Desviacin media
Esta medida es mas acorde que la de amplitud, ya que involucra a todos los valores del conjunto de
observaciones corrigiendo la desviacin. sta medida se obtiene calculando la media aritmtica de la muestra,
y luego realizando la sumatoria de las diferencias de todos los valores con respecto de la media. Luego se
divide por el nmero de observaciones.
Una medida como sta tiene la ventaja de que utiliza cada observacin y corrige la variacin en el nmero de
observaciones al hacer la divisin final. Y por ltimo tambin se expresa en las mismas unidades que las
observaciones mismas.
Varianza
Existe otro mecanismo para solucionar el efecto de cancelacin para entre diferencias positivas y negativas.
Si elevamos al cuadrado cada diferencia antes de sumar, desaparece la cancelacin:
Esta frmula tiene una desventaja, y es que sus unidades no son las mismas que las de las observaciones, ya
que son unidades cuadradas.
Desviacin tpica
Entonces en este caso la unidad de s es la misma que la del conjunto de observaciones de la muestra
estadstica.
Una distribucin de los datos en categoras que ha demostrado ser til al organizar los procedimientos
estadsticos, es la distincin entre variables discretas y variables continuas. Una variable discreta es
sencillamente una variable para la que se dan de modo inherente separaciones entre valores observables
sucesivos. Dicho con mas rigor, se define una variable discreta como la variable tal que entre 2 cualesquiera
valores observables (potencialmente), hay por lo menos un valor no observable (potencialmente). Por
ejemplo, un recuento del nmero de colonias de un cultivo en agar es una variable discreta. Mientras
que cuentas de 3 y 4 son potencialmente observables, no lo es una de 3,5.
Una variable continua tiene la propiedad de que entre 2 cualesquiera valores observables (potencialmente),
hay otro valor observable (potencialmente). Una variable continua toma valores a lo largo de un continuo, esto
es, en todo un intervalo de valores. Longitudes y pesos son ejemplos de variables continuas. La estatura de
una persona, pude ser 1,70 mts. 1,75 mts., pero en potencia al menos podra tomar cualquier valor
intermedio como 1,73 mts. por ejemplo.
Un atributo esencial de una variable continua es que, a diferencia de lo que ocurre con una variable discreta,
nunca se la puede medir exactamente. Con una variable continua debe haber inevitablemente un error de
medida.
Un importante principio sobre variables continuas es que siempre se registran en forma discreta, quedando la
magnitud de la distancia entre valores registrables adyacentes determinada por la precisin de la medicin.
Una poblacin de unidades es un grupo de entidades que tienen alguna caracterstica cuantificable en
comn.
Las unidades pueden ser personas, rboles, bacterias, compuestos qumicos, etc.. Pueden ser finitas o
infinitas en nmero. La caracterstica cuantificable puede ser una variable continua o discreta.
Una poblacin de observaciones es un grupo que consiste en los valores numricos de una caracterstica
cuantificable determinada en cada elemento de una poblacin de unidades.
La misma poblacin de unidades tendr en ocasiones mas de una poblacin de observaciones asociada.
Una muestra de unidades es un nmero finito de unidades procedentes de una poblacin de unidades.
Es decir una muestra es una parte de una poblacin que aislamos para estudiarla.
Este concepto es de importancia para el anlisis estadstico porque por lo general uno dispone de una
muestra de una poblacin para el estudio que intenta realizar. Por ejemplo, si necesitramos hacer un
promedio de todas las alturas de los habitantes de un pas de 200.000.000 de habitantes (esta sera la
poblacin estadstica), es lgico suponer lo engorroso que sera medir la altura de todos. Esto se realiza
midiendo las alturas de una muestra de esta poblacin, por ejemplo 10.000 habitantes. Este procedimiento es
inductivo ya que el investigador saca conclusiones acerca de la poblacin basndose en el anlisis de una
muestra de esa poblacin; esto es hacer una inferencia acerca de una poblacin partiendo de una muestra.
Se llama inferencia estadstica una conclusin que se refiere a una poblacin de observaciones, obtenida
sobre la base de una muestra de observaciones.
Muestra aleatoria
Una muestra aleatoria es una muestra sacada de una poblacin de unidades, de manera que todo elemento
de la poblacin tenga la misma probabilidad de seleccin y que las unidades diferentes se seleccionen
independientemente.
Se llama variable aleatoria aquella que toma diversos valores o conjuntos de valores con distintas
probabilidades. Existen 2 caractersticas importantes de una variable aleatoria, sus valores y las
probabilidades asociadas a esos valores.
Una tabla, grfico o expresin matemtica que d las probabilidades con que una variable aleatoria toma
diferentes valores, se llama distribucin de la variable aleatoria.
Como vimos anteriormente, la inferencia estadstica se relaciona con las conclusiones que se pueden sacar
acerca de una poblacin de observaciones basndose en una muestra de observaciones. Entonces
intervienen las probabilidades en el proceso de la seleccin de la muestra; en este caso se desea saber algo
sobre una distribucin con base en una muestra aleatoria de esa distribucin.
De tal manera vemos que trabajamos con muestras aleatorias de una poblacin que es ms grande que la
muestra obtenida; tal muestra aleatoria aislada no es mas que una de muchas muestras diferentes que se
habran podido obtener mediante el proceso de seleccin. Este concepto es realmente importante en
estadstica.
La distribucin de un estadgrafo en todas las muestras aleatorias de tamao n tomadas de una poblacin, se
llama distribucin muestral del estadgrafo para muestras aleatorias de tamao n.
Definicin
Una muestra aleatoria simple de tamao n de una poblacin de tamao N, es una muestra escogida de tal
manera que todo grupo de n unidades diferentes tiene igual probabilidad de ser escogido como muestra.
Distribucin normal
La distribucin que ocupa la posicin central en la teora y prctica estadsticas, es la distribucin normal.
No hay variable aleatoria observable que siga exactamente la distribucin normal, y muchas variables que se
dan en la experiencia normal no tienden a seguir esta distribucin.
La expresin matemtica de la densidad normal es:
El rea total bajo la curva es 1, ya que las reas bajo las curvas de densidad dan probabilidades y puesto que
debe presentarse algn valor de x entre mas infinito y menos infinito; lo cual es lo mismo que decir que la
probabilidad de que x caiga en algn punto debe ser 1.
La distribucin normal es una numerosa familia de distribuciones que corresponden a los muchos
valores diferentes de y de .
Es esencial una simplificacin para tabular las probabilidades normales para varios valores de los parmetros.
Esto es posible por medio del procedimiento llamado tipificacin. Geomtricamente equivale a convertir la
escala bsica de valores x de modo que se mida en una escala patrn en la que corresponda el valor cero y
en la que la unidad de medida sea 1 desviacin tpica (s); es decir, se convierten las medidas a nmeros
expresados en s como unidades por encima o por debajo de la media.
De modo simple, la Estadstica es una coleccin de datos numricos que, referidos a un colectivo, permiten la
representacin y anlisis del mismo.
Cuando los estados nacionalistas empezaron a surgir durante ese perodo, fue
necesario obtener informacin acerca de los territorios bajo la jurisdiccin de
cada nacin. Esta necesidad de informacin numrica acerca de los ciudadanos
y recursos lleva al desarrollo de tcnicas para obtener y organizar datos
numricos.
La estadstica descriptiva o deductiva trata del recuento, ordenacin y clasificacin de los datos obtenidos en
las observaciones. Para que la mente pueda interpretar datos muy numerosos, es preciso resumirlos o
reducirlos. La estadstica descriptiva sirve como herramienta o instrumento para describir, resumir o reducir
las propiedades de un conjunto de datos para que se puedan manejar.
En definitiva, comprende aquellas tcnicas que se usan para resumir la
informacin (largas listas de valores) para proporcionar ndices simples y
comprensibles y, por lo tanto, para facilitar descripciones y comparaciones,
hacindolo de la forma ms exacta posible.
Estadstica Inferencial
Por su parte, la estadstica inferencial o inductiva trata de llegar a conclusiones que sobrepasan el alcance de
los datos analizados; es decir, se trata de tcnicas que se emplean para inferir o deducir caractersticas
desconocidas a partir de un conjunto de datos conocidos, apoyndose fundamentalmente en el clculo de
probabilidades.
La inferencia estadstica es una tcnica mediante la cual se obtienen generalizaciones o se toman decisiones
en base a una informacin parcial o completa obtenida mediante tcnicas descriptivas.