Sei sulla pagina 1di 22

Descripcin de Datos Univariante

QU ES LA ESTADSTICA
Por Estadstica entendemos una batera de recursos cientficos por los
cuales podemos recolectar, organizar, resumir, presentar y analizar datos
que provienen de un conjunto de datos con el objetivo de comunicar
informacin sobre cierto fenmeno y ayudar a la toma de decisiones.

Descripcin de Datos Univariante


Primeros conceptos
Individuo (unidad estadstica): soporte de los datos de inters en la
investigacin.
Poblacin: conjunto homogneo de individuos sobre los que se estudia las
caractersticas observables o medibles. Puede ser finita o infinita.
o de individuos o unidades estadsticas, estos son portadores de datos para
la investigacin a realizar.
Muestra: una parte de la poblacin y se caracteriza por su tamao n.
Slo interesa las muestras representativas con caractersticas similares a
las caractersticas de la poblacin.
Variable aleatoria : una caracterstica poblacional que cambia de un
individuo a otro y que se pretende observar o medir mediante una
muestra.
Dato: valor (cualitativo o numrico) de una variable aleatoria en un
individuo muestral.

Descripcin de Datos Univariante


Una variable aleatoria se representa con una letra mayscula X y un dato genrico
con la letra en minscula indexado xj para indicar su jerarqua.
Ejemplo de dato:
Las 27 letras del alfabeto espaol son datos y una ordenacin de letras proporciona
una informacin: CASO, COSA, ASCO, SACO .
Las 10 cifras del sistema decimal son datos y una ordenacin de cifras proporciona
una informacin: 147, 174, 417, 471, 714, 741.

Tipos de variables
Cualitativa nominal (dicotmica / politmica).
Cualitativa ordinal cuyas modalidades son jerrquicas.
Cuantitativa discreta para recuento de entes indivisibles.
Cuantitativa continua para medicin (con submltiplos).

Descripcin de Datos Univariante


Tipos de variables y escalas
Cualitativa nominal

Escala nominal

Cualitativa ordinal

Escala ordinal (Likert)

Cuantitativa discreta Escala de enteros ()


Cuantitativa continua Escala de razn
Escala de intervalo valores negativos

Descripcin de Datos Univariante


Tipos de variables y tablas estadsticas
Variable

discreta X (nominal, ordinal o cuantitativo discreto):

Se asocia a cada valor a su recuento simple , luego se puede agregar la


frecuencia simple, el recuento acumulado, o la frecuencia acumulada.
Valor

Recuento

Descripcin de Datos Univariante


Variable cuantitativa continua X:
Se agrupa los valores contiguos en intervalo cerrado-abierto, .
El punto medio del intervalo, , es la marca de clase; valor referencial para todos los valores del
intervalo (que se igualan a la marca de clase).
Por tanto, las marcas de clase son los valores de una variable aleatoria discreta que simula la
variable aleatoria continua X. Luego se tabula contando el nmero de datos dentro del intervalo
correspondiente

Descripcin de Datos Univariante

Descripcin de Datos Univariante

Descripcin de Datos Univariante


Tipos de variables y grficas
Cualitativa nominal

Diagrama de sectores

Cualitativa ordinal

Diagrama de barras

Cuantitativa discreta

Diagrama de bastones

Cuantitativa continua Histograma

Descripcin de Datos Univariante

Descripcin de Datos Univariante


Diagrama de Tallo y Hojas

Descripcin de Datos Univariante


Diagrama de caja y patillas (Boxplot)

Descripcin de Datos Univariante


Aspectos interesantes de una distribucin de frecuencias:

Su posicin: en torno a qu valor central se reparten los valores la variable.


Su dispersin: el grado de concentracin de los valores de la variable
alrededor de su posicin central.
Su forma:
Grado de asimetra: asimtrica a la izquierda,
simtrica,
asimtrica a la derecha
Grado de apuntamiento: leptocrtica (distribucin puntiaguda)
mesocrtica (similar a la normal estndar)
platicrtica (distribucin aplanada)
Determine dos conjuntos de cinco datos que tengan:
la misma posicin y distinta dispersin,
La misma dispersin y distinta posicin.

Descripcin de Datos Univariante


Estadgrafos de tendencia
La moda es el valor ms frecuente (dato nominal, ordinal y numrico)

No siempre existe, No siempre es nica.


La mediana P50 es el valor ubicado en el centro de la serie estadstica.
(dato ordinal y numrico)
Cuando no existe se considera un par de valores centrales
promedio
Cuando existe es nica.
La media aritmtica o (dato numrico)
Siempre existe y es nico.
Posiciones relativas de la moda, mediana y media aritmtica
Con respecto a la moda, la mediana se halla fuera en direccin de la cola
alargada ; y la media aritmtica se localiza an ms lejos.

Descripcin de Datos Univariante

Estadgrafos de posicin
Los tres cuartiles dividen el recorrido en cuatro segmentos que contienen
cada uno 25% de los datos.
Los nueve deciles dividen el recorrido en diez segmentos que contienen
cada uno 10% de los datos.
Los noventainueve percentiles dividen el recorrido en cien segmentos
que contienen cada uno 1% de los datos.

Descripcin de Datos Univariante


Estadgrafos de dispersin
El recorrido es el N de modalidades o la distancia entre los valores mayor y menor.
(dato nominal, ordinal y numrico)
El recorrido intercuartlico es la distancia entre el primer y tercer cuartil
(dato ordinal y numrico)
La desviacin tpica es la raz cuadrada de la varianza muestral .
La varianza es la media de las desviaciones cuadrticas
Todas se expresan con la unidad de los datos a la salvedad de la varianza que se escribe
sin unidad.
Grado de libertad

Caracteriza el conjunto de todas las muestras de tamao n, se introduce en las


frmulas para la objetividad del raciocinio estadstico.

Descripcin de Datos Univariante


Estadgrafos de forma
El sesgo (coeficiente de asimetra) mide la deformacin horizontal de la distribucin:
cuando la cola izquierda es mayor que la cola derecha.
cuando la cola izquierda es igual a la cola derecha.
cuando la cola izquierda es menor que la cola derecha.
La curtosis (coeficiente de apuntamiento) mide la deformacin vertical de la distribucin:
cuando la distribucin es puntiaguda (distribucin leptocrtica)
cuando la distribucin es normal
(distribucin mesocrtica)
cuando la distribucin es aplanada (distribucin platicrtica)
Otros estadgrafos
Los momentos centrados de orden k, , son tambin estadgrafos
cuyo impacto se degrada para ordenes elevados.
Por eso, la media aritmtica
y la varianza son los estadgrafos ms importantes en
Estadstica.

Descripcin de Datos Univariante


Tipos de simetra

Descripcin de Datos Univariante


La forma del histograma depende del nmero de clases

Descripcin de Datos Univariante


Histograma y diagrama de cajas
Relacione cada histograma con su diagrama de cajas y patillas

Descripcin de Datos Univariante


Tipificacin de datos: (puntaje)
Consiste en restarle a cada dato la media aritmtica de todos los datos de la muestra
(centrar los datos) y dividir por la desviacin tpica (reducir los datos).
Representa la distancia del dato a la media aritmtica expresada en desviaciones
tpicas. El signo del puntaje indica si el dato es mayor o menor que la media aritmtica.
Utilidad de la tipificacin:
Eliminar los efectos de las unidades de medida.
Detectar posibles valores atpicos en los datos.
Realizar comparaciones de los valores de una variable en diferentes poblaciones.
Compara los valores de diferentes variables en la misma poblacin.
Cunto vale la media aritmtica y la desviacin tpica de los puntajes?

Descripcin de Datos Univariante


Efecto de tipificar un conjunto de datos:

Potrebbero piacerti anche