Sei sulla pagina 1di 37

PROGRAMA

Estadística Descriptiva
1. Introducción a la estadística: clases
2. Distribuciones de frecuencia: tablas y gráficos.
3. Medidas descriptivas: tendencia central, de dispersión y de forma.
4. Población, Muestra, Muestreo.
Definición de Estadística
Es el conjunto de técnicas que se emplean para la recolección,
organización, análisis e interpretación de datos.” (Kazmier, 1998:1).

“El tema de la estadística moderna abarca la recolección, presentación y


caracterización de información para ayudar tanto en el análisis de datos
como en el proceso de toma de decisiones.” (Berenson y Levine, 1996:2)

“Método científico de operar con los datos y de interpretarlos.” (Portus,


1994:3)

La ciencia de reunir, organizar, presentar, analizar e interpretar datos para


ayudar a tomar decisiones (Lind, 2000, P.3)

Es una técnica del método científico que proporciona instrumentos para la


toma de decisiones.
Definición de Estadística
La Estadística es la Ciencia de la

• Sistematización, recolección, ordenación y


presentación de los datos referentes a un fenómeno que
presenta variabilidad o incertidumbre para su estudio
metódico, con objeto de

• Deducir las leyes que rigen esos fenómenos,

• Y poder de esa forma hacer previsiones sobre los mismos,


tomar decisiones u obtener conclusiones.
Clasificación de la
Estadística

Variables Cuantitativas o Numéricas


Estadística Descriptiva: Son métodos que incluyen la recolección,
presentación y caracterización de un conjunto de datos con el fin de
describir apropiadamente las diversas características de ese conjunto de
datos.

Variables Cualitativas o Categóricas


Estadística Inferencial: Métodos que permiten estimar las
características de una población para la toma de decisiones referentes a
una población, basándose solo en los resultados de la muestra.
Método Científico y Estadística

Plantear Diseñar
hipótesis experimento

Obtener Recoger datos


conclusiones y analizarlos
¿Qué es el Análisis Estadístico?

“ Ciencia que recoge, ordena y analiza los datos de una


muestra extraída de una determinada población, para
hacer inferencias de esa población valiéndose del cálculo
de probabilidades” (Amon, 1979)
¿Para qué sirve?

• Para validar la inducción propia de las ciencias empíricas (procuran


encontrar relaciones de tipo general capaces de explicar el
comportamiento de uno o varios eventos reales cuando se dan las
circunstancias apropiadas y que pueden ser descubiertas y verificadas
observando el mundo tángible): medicina, biología, psicología,
sociología, educación, intervención social, veterinaria, ingeniería
• Para disminuir la incertidumbre.
¿De qué Depende el Análisis
Estadístico?

• Tipo de Investigación

 Tipo de Variable
Variables

Una variable es una característica observable que varía entre los diferentes
individuos de una población. La información que disponemos de cada individuo es
resumida en variables. Son elementos que pueden variar.

En los individuos de la población venezolana, de uno a


otro es variable:

 El grupo sanguíneo: {A, B, AB, O}  Var. cualitativa


 Su nivel de felicidad “declarado”: {Deprimido, Normal, Muy
Feliz}  Var. Ordinal
 El número de hijos: {0,1,2,3,...}  Var. Numérica discreta
 La altura: {1,62 ; 1,74; ...}  Var. Numérica continua
Tipos de Variables
Variables Discretas
• Son las que utilizan números o valores enteros

• No se pueden fraccionar

• Ejemplos: N. Hijos, Libros, Autos

Variables Continuas
• Si entre dos valores, son posibles infinitos valores intermedios

•Son las que utilizan números o valores fraccionados

• Ejemplos: Estatura, Peso Corporal, Precios, Niveles de Ingresos


Variables Cualitativas
• Hacen Referencia a Calidad y no a Cantidad.

• Uso de Números es Convencional

• Ejemplos: Sexo: 1 = Masculino


• 2 = Femenino

Variables Cuantitativas
• Representan Cantidades

• Ejemplos: Edad, Estatura, Peso Corporal


Variables Dependientes
• Son aquellas que dependen de otras variables para ser explicadas

• Ejemplos: Consumo , Celular, Autos, Bombillas, etc.

Variables Independientes
• Son autónomas, no dependen de otras variables para ser explicadas

• Ejemplos: Ingreso, Línea, Gasolina, Electricidad, etc.


Variables Nominales
• Si sus valores no se pueden ordenar

• Ejemplos: Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar


(Sí/No).

Variables Ordinales
• Si sus valores se pueden ordenar:

• Ejemplos: Fichas del Domino, las cartas, Grado de satisfacción


Variables Finitas
• Si sus valores se pueden contar

• Son aquellas que poseen limites

• Ejemplos: N. pupitres por aula, número de cigarros en una caja

Variables Infinitas
• Si sus valores no se pueden contar

• Ejemplos: Los números…………..


Nota Importante

UNA VARIABLE:
SE MIDE
CAMBIA
Relación entre el Tipo de Variable y el Estadístico a Utilizar

Tipo de Variable Nivel de Medición Prueba Estadística

Cuantitativa Intervalo Paramétrica


Razón

Cualitativa Nominal No Parametrica


Ordinal
Conceptos Básicos

Población: Es la totalidad de los datos que pueden reunirse u observarse


de un determinado problema.
Muestra: Es un subconjunto de un conjunto determinados de datos.
Muestreo: Es el procedimiento para seleccionar la muestra.
Estadígrafo: Es un dato estadístico perteneciente a la muestra.
Parámetro: Es un dato estadístico perteneciente a la población.
Dato: Es el conjunto de observaciones de un determinado problema.
Dato Estadístico: Es el resultado de una operación estadística o
matemática que se realiza sobre un determinado problema.
Tipo de Investigación

Descriptiva: Procura definir las cualidades de un evento.


Comparativa: Persigue establecer similitudes o diferencia la presencia de
una variable entre dos o mas grupos.
Correlacional: Busca encontrar relaciones / asociaciones entre variables
Explicativa: Establece la naturaleza de la relación de causalidad entre una
o diversas variables independientes con una o unas variable dependiente.
ANALISIS E INTERPRETACION DE DATOS
DSB
TIPO DE VARIABLE

TIPO DE INVESTIGACION PALABRAS CLAVES ORDINAL Y NOMINAL INTERVALO Y RAZON

Clasificar, Categorizar, Moda, Media, Mediana,Varianza,


DESCRIPTIVA Cualificar, Cuantificar, Distribución de Frecuencia, Desviación standard,
Jerarquizar, Enumerar, Gráficos (Histogramas , Coeficientes de variación,
(Summary Statistic) Ponderar Líneas, Pasteles ) Kurtosis, Asimetría
+
Comparar, Diferenciar,
COMPARACION Equiparar, Igualar, 2G Wilcoxon t de student
Contrastar (grupos)
( One, two, Multi-sample test )  Analisis de la Varianza
2G Kruskall- Wallis ( ANOVA )
Prueba de Medias ( Tukey , LSD ,
.........)
Relacionar , Asociar,
RELACION Vincular, ( Unión, Nexo ) Chi cuadrado
Correlación de Pearson

( Association Test ) Rangos de Spearman

Consecuencia Analisis Multivariado Regresión simple


CAUSA Causa Correlaciones Canónicas Regresión multiple
Efecto Factores comunes
EFECTO Incidencia Cluster analisis
(conglomerados)
( linear Models ) Analisis discriminantes
Análisis Descriptivo de acuerdo a la Escala de Medida

Escala de Frecuencia Medidas de Medidas de Medidas de Gráficos


medida Posición dispersión Distribución

Nominal Si Moda No No Sectores y


(discreta) Barras

Ordinal Si Moda No No Sectores y


(discreta) Barras

Escala No Media, Si Si Histograma,


(continua) Mediana, Áreas
Moda Dispersión
Análisis Descriptivo y
Exploratorio
Finalidad del Análisis Exploratorio de Datos (AED)

La finalidad del Análisis Exploratorio de Datos (AED) es examinar los datos


previamente a la aplicación de cualquier técnica estadística. De esta forma el
analista consigue un entendimiento básico de sus datos y de las relaciones
existentes entre las variables analizadas.

El AED proporciona métodos sencillos para organizar y preparar los datos,


detectar fallos en el diseño y recogida de datos, tratamiento y evaluación de
datos ausentes, identificación de casos atípicos y comprobación de los
supuestos subyacentes en la mayor parte de las técnicas multivariantes.
DISTRIBUCION NORMAL
Un breve Resumen Sobre Estadísticos

• Posición
Dividen un conjunto ordenado de datos en grupos con la misma cantidad de
individuos. Indican la posición de la medidas: Cuartiles, percentiles, deciles.

• Tendencia central
Indican valores con respecto a los que los datos parecen agruparse: Media,
mediana y moda.

• Dispersión
Indican la mayor o menor concentración de los datos con respecto a las
medidas de centralización: Desviación típica, coeficiente de variación,
rango, varianza.

• Forma
Asimetría y apuntamiento o curtosis
Tendencia Central

• En este caso son medidas que buscan


posiciones (valores) con respecto a los
cuales los datos muestran tendencia a
agruparse.
 Moda (‘mode’) Es el/los valor/es donde la
distribución de frecuencia alcanza un máximo. En
otras palabras es la mayor frecuencia absoluta, el
valor que más se repite.
 En una variable Discreta la moda esta dada por: el dato
observado (Yi) de la mayor frecuencia absoluta.

 En una variable Continua la moda esta dada por: el punto


medio o marca de clase de la mayor frecuencia absoluta.

 En estas se tiene la clase modal que se refiere a:


- Una sola moda: Unimodal
- Dos modas: Bimodal
- Mas de dos modas: Plurimodal
Media (‘mean’): Es la media aritmética (promedio) de los
valores de una variable. Suma de los valores dividido por el
tamaño muestral.

 Media de 2,2,3,7 es (2+2+3+7)/4=3,5. Caso Discreto


 Media Caso Continuo: (Formula)
 Conveniente cuando los datos se concentran
simétricamente con respecto a ese valor. Muy sensible a
valores extremos.
 Es el centro de la distribución (datos) ordenada
• Mediana (‘median’): Es un valor que supera a no más de la mitad
de las observaciones y a la vez es superado por no más de la mitad
de las observaciones.

• Caso variable Discreta


 Mediana de 1,2,4,5,6,6,8 es 5. Cuando n (muestra es impar)
 Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5. Cuando n es par:
(a+b)/2
Es conveniente cuando los datos son asimétricos. No es sensible a
valores extremos.

Caso variable Continua


Medidas de dispersión
Medidas de dispersión

Miden el grado de dispersión (variabilidad) de los datos, independientemente de


su causa.

0.05
Mín. P25 P50 P75 Máx.

0.04
• Amplitud o Rango (‘range’):

0.03
Diferencia entre observaciones extremas.
– 2,1,4,3,8,4. El rango es 8-1=7 25% 25% 25% 25%

0.02
– Es muy sensible a los valores extremos.
Rango intercuartílico

0.01
Rango
• Rango intercuartílico (‘interquartile range’):

0.00
– Es la distancia entre primer y tercer cuartil.
• Rango intercuartílico = P75 - P25
150 160 170 180 190

– Parecida al rango, pero eliminando las observaciones más extremas inferiores y


superiores.

– No es tan sensible a valores extremos.


 Varianza S2 (‘Variance’): Mide el promedio de las desviaciones (al cuadrado) de las
observaciones con respecto a la media.

1
S   ( xi  x ) 2
2

n i

 Es sensible a valores extremos (alejados de la media).

 Sus unidades son el cuadrado de las de la variable. De interpretación difícil para un


principiante.
S S 2
Desviación típica (‘standard deviation’)
Es la raíz cuadrada de la varianza

 Tiene las misma dimensionalidad


(unidades) que la variable. Versión 50

‘estética’ de la varianza.
40

 Cierta distribución que veremos más


adelante (normal o gaussiana)
30
quedará completamente determinada
por la media y la desviación típica.
20

10
Desv. típ. = 568,43
Media = 2023
0 N = 407,00
1. 1 2 2. 2 3
50 90 30 . 70 . 10 50 . 90 . 30
0 0 0 0 0 0 0 0

Peso recién nacidos en partos gemelares


S
Coeficiente de variación CV 
x
Es la razón entre la desviación típica y la media.
– Mide la desviación típica en forma de “qué tamaño tiene con respecto a la media”

– También se la denomina variabilidad relativa.

– Es frecuente mostrarla en porcentajes


• Si la media es 80 y la desviación típica 20 entonces CV=20/80=0,25=25% (variabilidad relativa)

• Es una cantidad adimensional. Interesante para comparar la variabilidad de


diferentes variables.
– Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan más
dispersión en peso que en altura.

• No debe usarse cuando la variable presenta valores negativos o donde el valor 0


sea una cantidad fijada arbitrariamente
– Por ejemplo 0ºC ≠ 0ºF
Dispersión en distribuciones normales

0.05
0.05

0.04
0.04

0.03
0.03

0.02
0.02

0.01
x 2s
0.01

x s
95 %
68.5 %

0.00
0.00

150 160 170 180 190


150 160 170 180 190

• Centrado en la media y a una desv. típica de distancia hay aproximadamente el 68% de


las observaciones.

• A dos desviaciones típicas tenemos el 95% (aprox.)

Potrebbero piacerti anche