Sei sulla pagina 1di 7

Apuntes del curso de estadstica v.

2017 I Introduccin

1. Introduccin
Conceptos de estadstica y recoleccin de datos.

La estadstica se ha convertido en el lenguaje matemtico para las ciencias y teoras del pensamiento. Te ayuda a
sacar conclusiones o tomar decisiones ahorrando tiempo, dinero y energa de cualquier fenmeno de estudio (mbito
profesional y acadmico). Estos apuntes corresponden a 15 mdulos diseados para 3 cursos de estadstica:

ESTADSTICA DESCRIPTIVA Y PROBABILIDAD. (Mdulos del 1 al 6)


ESTADSTICA INFERENCIAL I (Mdulos del 7 al 10)
ESTADSTICA INFERENCIAL II (Mdulos del 11 al 15)

Los cursos tratan exclusivamente el enfoque clsico, paramtrico y los ejemplos estn basados en estudios
observacionales (de medicin) y tericos con fines de aprendizaje. El curso tiene enfoque pragmtico.

EL LENGUAJE DE LAS ESTADSTICAS.

La estadstica es ciencia de recolectar, describir e interpretar datos. Involucra el manejo de


informacin, nmeros y grficos. Se utiliza para economizar tiempo, dinero y energa; tambin ayuda
a tomar decisiones matemticamente. La estadstica clsica comnmente se divide en:

Descriptiva Trata de la recoleccin y descripcin


Se usa para describir una de datos de una o ms muestras o
muestra o poblacin pequea. de la poblacin.

Estadstica
Inferencial Son tcnicas para interpretar e
inferir una poblacin a partir de
Se usa cuando la poblacin a muestras, ayuda a tomar
estudiar es muy grande o desiciones y se basa en la
infinita probabilidad.

Ten en cuenta los siguientes trminos:

Elemento (estadstico): entidad, individuo, objeto o evento cuyas propiedades se analizarn.

Poblacin: coleccin o conjunto de elementos cuyas propiedades se analizarn. Es el total de los


datos que nos interesa conocer. Cuando se inicia un estudio estadstico el primer paso es definir la
poblacin cuidadosamente. Existen dos tipos de poblaciones:

Poblacin finita: cuando los miembros o elementos de una poblacin tienen un lmite de medidas u
observaciones contables.

Poblacin infinita: cuando los miembros o elementos de una poblacin son infinitas, no tienen un
lmite de medidas u observaciones. En ocasiones, algunas poblaciones son tan grandes, que
conviene manejarlas como infinitas (depender de la experiencia de la persona).

Javier.urcadiz@gmail.com
Apuntes del curso de estadstica v.2017 I Introduccin

Muestra: Es el subconjunto de una poblacin. Consiste en los elementos seleccionados de la


poblacin (preferentemente, debe ser una seleccin aleatoria).

Variable: Es la caracterstica de inters acerca de la cada elemento individual de una poblacin o


muestra.

Nominal:
{Caf, azul, rojo} {BCN, DF, NL...}
Cualitativa
(atributo) Ordinal:
{Grande, mediana, chica} {Alto, bajo}
Variable
Discreta:
Cuantitativa 2 hijos, 10 fsiles, 3 pelotas
(numrica)
Continua:
23.4 C, 3.4 g, 3.7 g, $32.65

La variable cualitativa nominal describe o nombra a un elemento de una poblacin. Por ejemplo el
color del cabello o lugar de procedencia de un individuo. La variable ordinal incorpora una posicin
ordenada o clasificacin de las variables cualitativas. Por ejemplo el nivel de calidad de un producto
en alto, medio y bajo.

La variable cuantitativa discreta se


refiere cuando el valor del dato es un Parmetros
nmero entero (sin fracciones ni
valores intermedios entre nmeros).
Por ejemplo el nmero de huracanes
que pasa en una regin, el nmero de
especies fsiles, la cantidad de hijos.
La variable continua se da cuando el
valor del dato es un nmero que
toma cualquier valoren una escala
continua. Puede tomar valores entre
dos nmeros. Por ejemplo 23.3, 24.8
y 32.2 grados; 3.4, 2.4, 3.89 g.
Estadsticos
Datos. El conjunto de valores
recolectados de la variable para cada
Datos de una variable continua (temperatura). Observe que la
uno de los elementos que media muestral (estadstico) es de 15.6 (n=10), mientras que la
pertenecen a una muestra. Una vez media poblacional es de 15.2 (N= 200). La muestra es una buena
recolectado todos los datos es aproximacin de la poblacin, siempre que se tome al azar.
comn referirse al conjunto de datos Tomado de Townend (2002).
como la muestra. Cada dato tiene un
valor del dato.

Javier.urcadiz@gmail.com
Apuntes del curso de estadstica v.2017 I Introduccin

Censo. Cuando todo elemento en la poblacin de inters se puede mencionar, observarse,


enumerarse o representarse en una lista, entonces se compila un censo.

Parmetro: Valor numrico que resume todos los datos de una poblacin entera. Por ejemplo la
media poblacional (), la varianza (2) y la desviacin estndar poblacional ().

Estadstico: Valor numrico que resume los datos muestrales. Por ejemplo la media muestral ( ), la
varianza (s2) y la desviacin estndar muestral (s).

Sesgo. Es la tendencia en un procedimiento de mensurabilidad de sobre estimar o sub estimar el


valor real de un parmetro.

ESTUDIOS OBERVACIONALES Y EXPERIMENTALES.

El mtodo emprico-analtico es un modelo de investigacin cientfica (emprico=experiencia). Se


basa en la lgica emprica junto con la observacin de fenmenos o experimentacin donde el
anlisis estadstico apoya contundentemente en la prueba de hiptesis.

En los estudios observacionales (que incluyen la medicin) el investigador no modifica el entorno es


decir, no controla el proceso a observar. Los datos se obtienen al tomar muestras (medir) de la
poblacin de inters por medio de un diseo de muestreo dado.

En un estudio experimental, el investigador controla o modifica el entorno y observa el efecto sobre


la variable bajo estudio, es decir, manipula las condiciones. Lo anterior se realiza a travs de
tratamientos o diseos experimentales (una rama propia de las estadsticas).

En los dos tipos de estudio, es posible medir numrica o cualitativamente a los elementos muestrales
que pueden ser objetos, eventos o personas. Al procedimiento de adquirir variables de lo que
expresa una persona se le llama encuesta.

Ya sea que realices un estudio observacional experimental debes tener en cuenta la exactitud y
precisin de la toma de datos.

MENSURABILIDAD vs. VARIABILIDAD.

En estadstica se deben de medir elementos: objetos, eventos, personas o cualquier unidad


experimental. La mensurabilidad define con qu precisin se realiza una medicin y con qu
exactitud se ejecuta el proceso de medicin. Cuando mides puede haber variaciones en la medicin.

La exactitud se refiere a que tanto nos aproximamos del valor real cuando medimos una variable. La
precisin se refiere a qu tanto vara un valor cuando lo medimos varias veces a travs del mismo
procedimiento, es la dispersin de un procedimiento para un mismo valor. Por ejemplo, si queremos
medir una temperatura real de 20 C y un termmetro A arroja constantemente 20 C ste es preciso
y exacto. S el termmetro B variara constantemente entre 18 y 22 C y el C vara ente 19 y 21 C el
C es ms preciso que B, pero ninguno de stos tan exacto como el termmetro A.

Javier.urcadiz@gmail.com
Apuntes del curso de estadstica v.2017 I Introduccin

Las variables tienen una variacin natural (por ejemplo cuando forman una distribucin normal). La
mensurabilidad de la variabilidad es el objetivo de la estadstica. S tu estudio necesita cierto grado
de exactitud, debers tener en cuenta la mensurabilidad de tu variable (precisin y exactitud) segn
el procedimiento y/o instrumentos de medicin. Con poca exactitud y precisin se obtendra un
sesgo en los resultados.

LA RECOLECCIN DE DATOS.

Una vez que tengas definido el tipo de estudio, investigacin o anteproyecto (pregunta, problema
o hiptesis) con previo marco terico estudiado, objetivos y metodologa dada, se procede a
recolectar datos.

La recoleccin de datos como parte de la metodologa debe ser un plan detallado de


procedimientos que conduzcan a reunir datos con un propsito especfico.

Algunos pasos recomendados en la recoleccin de datos son los siguientes:

1) Define el objetivo claramente. Consltalo con personas experimentadas.


2) Definir la variable y la poblacin de inters. Delimita tu estudio a tu alcance (verifica recursos).
3) Define como recolectar datos y los esquemas de medicin: diseo de muestreo,
procedimientos, tamao de muestra, dispositivo de medicin, etiquetados y/o
almacenamiento de la informacin.
4) Recolecta una muestra piloto, revsala y analiza el procedimiento.
5) Ordena tus datos recolectados (preferentemente en digital y con copias fsicas).

DISEO DE MUESTREO.

Hay dos tipos de diseos muestrales: las muestras dirigidas (no probabilsticas) y las probabilsticas.

Muestras dirigidas: muestras que se seleccionan sobre la base de juzgarse tpicas o buenas de
cada persona. Este tipo de muestreo no es un procedimiento estadstico aceptable. Una prctica
comn es cuando las personas elijen realizar una encuesta por ejemplo en internet (muestras
voluntarias). Otra modalidad es cuando el interesado selecciona objetos o gente bajo su criterio por
la comodidad o cercana de los elementos muestrales (muestra de conveniencia), provocando una
falta de cobertura de la poblacin real. Las muestras dirigidas estn en principio sesgadas.

Muestras voluntarias
Las muestras dirigidas estarn
Mtodos de muestreo siempre sesgadas. No son
dirigido
procedimientos formales.
Muestras de conveniencia

Javier.urcadiz@gmail.com
Apuntes del curso de estadstica v.2017 I Introduccin

Muestras probabilsticas: muestras en las que los elementos a seleccionar se extraen sobre la base
de la probabilidad (aleatoriamente). Cada elemento en una poblacin tiene cierta posibilidad de ser
seleccionado como parte de la muestra. Es un procedimiento estadstico formal.

Los mtodos para obtener muestras probabilsticas comnmente son los siguientes:

Muestreo aleatorio simple


(MAS)
Mtodos sencillos
Adquisicin de
datos aleatorios Muestreo sistemtico (MS)

Muestras
probabilsticas Muestro aleatorio
Mtodo de estratificado (MAE)
muestreo

Mtodos Muestreo aleatorio


Muestras estratificado proporcional
mltiples (MAEP)
dirigidas

Muestreo por
No aceptable
conglomerados (cluster)
estadsticamente (MC)

Cmo logro que mi muestra sea representativa de la poblacin? Tomando muestras aleatorias,
donde la muestra debe tener caractersticas proporcionales a la poblacin. La representatividad
la puedes alcanzar con diferentes tcnicas aleatorias.

TCNICAS DE NMEROS ALEATORIOS.

Una vez que tengas identificados los elementos de la poblacin, ordenados


en un espacio, tiempo o una lista; tendrs que tomar la muestra de manera
aleatoria con alguno de los mtodos anteriores. Las tcnicas para tomar
elementos al azar son:

1) Uso de urnas.
2) Tabla de nmeros aleatorios.
3) Genera nmeros en tu calculadora con la tecla shift +N+RAN.
4) Por medio de una aplicacin (App) desde tu mvil.
5) Con un software (como Excel, Matlab, Minitab, R) pginas web. Random Lite
Aplicacin gratuita
para celular
MTODOS PROBABILSTICOS SENCILLOS.

Javier.urcadiz@gmail.com
Apuntes del curso de estadstica v.2017 I Introduccin

Es un diseo muestral en el que los elementos de una poblacin o marco se tratan igual y no hay
subdivisiones.

Muestreo aleatorio simple (MAS): Es la muestra seleccionada de tal forma que todo elemento en la
poblacin (o marco muestral) tiene la misma probabilidad de ser elegido. Las muestras se obtienen
al muestrear con reemplazo en poblaciones finitas y sin reemplazo en poblaciones infinitas. Toma
muestras con reemplazo en poblaciones finitas y sin reemplazo en poblaciones infinitas.

Muestreo aleatorio sistemtico (MS): Muestra en la que se selecciona a cada k-simo elemento de
N
la poblacin o marco muestral a partir de un primer elemento. Donde el elemento k= , N=
n
poblacin y n= al tamao de la muestra. Por ejemplo, si deseamos seleccionar 5 muestras (n=5) en
un poblacin N=100, k ser 20. Posteriormente se elige con un MAS entre el 0 y 20 para determinar
el primer elemento y a partir de ste, se le suma k sistemticamente. S el MAS arroja el nmero 4,
entonces se muestrear los siguientes 5 elementos {424.44.64.84}.

Ejercicio: Realice un MAS en el saln y obtenga n=3 y b) realice un MS con muestras de una playa.

MTODOS PROBABILSTICOS MLTIPLES.

Diseo muestral en el que los elementos del marco o poblacin se subdividen y la muestra se elige
en ms de una etapa aleatoriamente. Cuando la poblacin es muy grande, con frecuencia se
subdivide sobre la base de ciertos criterios. Estos criterios se deben definir y justificar. Las
subpoblaciones resultantes se llaman estratos. Cada estrato se puede manejar por un MAS o MS.

Muestreo aleatorio estratificado (MAE): Muestra que se obtiene al estratificar la poblacin o marco
muestral y posteriormente se seleccionan los elementos de cada estrato con un MAS o MS. Por lo
general, las subdivisiones suelen darse de manear natural. Por ejemplo s caracterizaras las rocas de
4 volcanes diferentes y tienes un mximo de 80 muestras disponibles, la estratificacin natural sera
tomar 20 muestras de cada volcn. Pero, en el caso de que uno de los 4 volcanes sea 100 veces ms
grande que los otros, conviene hacer estratos proporcionales.

Muestreo aleatorio estratificado proporcional (MAEP): Muestra que se obtiene al estratificar la


poblacin o marco muestral y posteriormente se obtiene un nmero de elementos proporcional al
tamao del estrato mediante un MAS o MS. Una idea para expresar la toma del elemento es
determinar una cuota, por ejemplo seleccionar 1 elemento a cada 150 de esta manera si tienes un
estrato de n=300 y otro n=4500, tomars proporcionalmente 2 elementos en el primer estrato y 30
en el segundo.

Muestreo por conglomerados ( clster) (MC): Muestra que se obtiene al estratificar la poblacin o
marco muestral y posteriormente se seleccionan algunos estratos de manera aleatoria tomando
todos los elementos dentro del estrato seleccionado. Se puede usar un MAS o MS para elegir los
estratos.

Ejercicio: Disee un MAE o MAEP para tomar 30 alumnos en su universidad o instituto.

Javier.urcadiz@gmail.com
Apuntes del curso de estadstica v.2017 I Introduccin

TAMAO DE MUESTRA.

Cuntas muestras debo tomar para mi estudio? No hay un nmero especfico porque depende de
muchos factores: costos, tiempos, objetivos, riesgos, Etc. Sin embargo una respuesta puede ser
toma todas las posibles, entre ms muestras tomes es mejor siempre que sean al azar.

Siempre que tomes muestras tendrs manera de justificar por qu decidiste ese nmero. Por
ejemplo, s cada muestra te cuesta 5 mil pesos, posiblemente quieras usar las menos posibles. Si tu
muestra tarda 3 meses en arrojar un resultado, quizs deberas tomar pocas muestras.

Por el momento, es recomendable tomar al menos 30 muestras hasta propiciar una distribucin
normal en los datos muestrales.

Cuanto tengas pocas muestras (por ejemplo menos de 15) debes usar tcnicas de estadstica NO
paramtrica (son temas fuera del presente curso). En estadstica paramtrica se utilizan frmulas
basadas en distribuciones de probabilidad donde se asume un nivel de confianza, un error mximo
y un tamao de muestra vinculados todos a la vez, por ejemplo:

( 2 )
n=( )2 donde Z( ) es el nivel de confianza que quieres trabajar y E es el error mximo deseado.
2
El detalle de la ecuacin es tener la 2 (varianza poblacional) de los datos, generalmente no la
tenemos por lo cual es posible estimarla.

El tamao de muestra se analizar en los captulos 9 y 10 (corresponde a un segundo curso:


estadstica inferencial).

Javier.urcadiz@gmail.com

Potrebbero piacerti anche