Sei sulla pagina 1di 30

Metodología I

Ayudantía
Christian Casanova
Estadística:
 Es la ciencia que trata de la Sistematización,
recogida, ordenación y presentación de los
datos referentes a un fenómeno que
presenta variabilidad o incertidumbre para
su estudio metódico, con objeto de:
 deducir las “leyes”- regularidades que rigen
esos fenómenos,
 y poder de esa forma hacer previsiones
sobre los mismos, tomar decisiones u
obtener conclusiones.
Tipos de estadística
 Estadística descriptiva: Procedimientos estadísticos que sirven
para organizar y resumir conjuntos de datos numéricos.
 Trata de la presentación de datos en gráficas o en distribuciones de
frecuencias, y de aplicar diversos promedios y medidas de
dispersión.

 Estadística inferencial: Procedimientos estadísticos que sirven


para deducir o inferir algo acerca de un conjunto de datos
numéricos (población), seleccionando un grupo menor de ello
(muestra).
 Funciona tomando una muestra de una población y efectuando
estimaciones acerca de una característica de esa población con base
en los resultados de muestreo.
Ejemplo:
 Suponga que tenemos datos de los ingresos de 1000 familias
chilenas.
 Este grupo de datos puede ser resumido encontrando el
promedio de ingreso por familia y su dispersión respecto al
promedio. También pueden ser descritos construyendo una tabla,
un diagrama o gráfico del número de familias en cada clase de
ingresos Esta es estadística descriptiva.
 Si estas 1000 familias son representativas de todas las familias
chilenas, podemos entonces estimar y probar hipótesis sobre el
promedio de ingreso familiar en Chile como un todo. Puesto que
estas conclusiones están sujetas a errores, tendríamos también
que indicar la probabilidad de error.  Esto es inferencia
estadística.
Población
 Conjunto de los individuos o cosas sometido a una evaluación estadística
mediante muestreo. RAE

 Conjunto de elementos de referencia sobre el que se realizan las


observaciones.

 Es el conjunto de todos los elementos considerados en una investigación


estadística, de los cuales nos interesa obtener cierto tipo de información
específica.

 Es el total del conjunto de elementos u objetos de los cuales se quiere


obtener información

 Conjunto o cúmulo de individuos u objetos cuyas propiedades se han de


analizar

 Población es el conjunto sobre el que estamos interesados en obtener


conclusiones (hacer inferencia).
 Al definir una población, se debe cuidar que el conjunto de
elementos que la integran quede perfectamente delimitado, de
modo que ante la presencia de un potencial integrante de la
misma, se pueda decidir si forma parte o no de la población bajo
estudio.

 Determinación geográfica (zona común, lugar o espacio


determinado)
 Según Necesidades
 Según hábitos
 Normalmente es demasiado grande para poder abarcarla.
Muestra
 Parte o porción extraída de un conjunto por métodos que
permiten considerarla como representativa de él.
 "Se llama muestra a una parte de la población a estudiar que
sirve para representarla". Murria R. Spiegel (1991).
 "Una muestra es una colección de algunos elementos de la
población, pero no de todos". Levin & Rubin (1996).
 Es un subconjunto de una población dada, destinado a
suministrar información sobre la población.
 Subconjunto de la población al que tenemos acceso y sobre el
que realmente hacemos las observaciones (mediciones)
Parámetros y Estimadores
 Parámetro:
Es una cantidad numérica calculada sobre una población
 Ej: La altura media de los individuos de un país
 La idea es resumir toda la información que hay en la población en unos pocos
números (parámetros).

 Estimador:
Es una cantidad numérica calculada sobre una muestra
 El cálculo de la estatura media de una m.a. de 1.000 individuos del país.
 La altura media de los que estamos en este aula. Somos una muestra
(¿representativa?) de la población.
Población Parámetro
Valor numérico que resume
todos los
datos de una población.

Muestra Estadístico o
Estadígrafo
La notación para Valor numérico que resume
identificar cada uno de todos los
estos valores numéricos datos de una muestra.
suele ser distinta para el
parámetro y para el
estadístico, aunque este
  Media Poblacional Parámetro
hablando del mismo x  Media Muestral  Estadístico
valor. Por ejemplo:
  Desv. Std. Poblacional Parámetro
10
s  Desv. Std. Muestral  Estadístico
Parámetros y estimadores
Cualquier característica medible de una muestra se
llama dato estadístico. Cualquier característica
medible de una población, como la media, se
denomina parámetro.

Normalmente nos interesa conocer un parámetro…

…Como no es posible estudiar a TODA la


población, calculamos un: estimador sobre una
muestra y “confiamos” en que sean próximos.

11
Señale si corresponde a

•Estimador, Parámetro, Dato

1. En la ciudad de Ovalle se toma una muestra de 450 asalariados y se


obtiene un salario promedio per cápita de $310.000._____________________

2. El Registro Civil informó que la proporción de nacimientos de varones


en Chile el año 2006 fue de 49,8%.__________________________

3. Mis gastos en locomoción son $ 2.000 semanales.______________________

4. El número de votantes en la elecciones presidenciales fue de


6.942.041 de personas, en base a datos recolectados por el Servicio
Electoral. ____________

5. Según las encuestas realizadas por el INE la tasa de desempleo en


Chile alcanzó al 6,7% en el primer trimestre del 2007.______________________
Estadísticos Descriptivos
Estadísticos descriptivos
 Tendencia central o Centralización: Media, mediana y moda
Indican valores con respecto a los que los datos parecen agruparse.
Una medida de tendencia central corresponde al valor que se encuentra en el centro
o en la mitad de un conjunto de datos.

 Dispersión: Desviación típica, coeficiente de variación, rango, varianza


Indican la mayor o menor concentración de los datos con respecto a las medidas de
centralización, describen la cantidad de dispersión, o variabilidad, que se encuentra
entre los datos.
Datos que se encuentran bastante agrupados tendrán valores relativamente pequeños
para estas medidas.

14
Estadísticos descriptivos

 Posición: Centiles: percentiles, cuartiles, deciles,...


Dividen un conjunto ordenado de datos en grupos con la misma cantidad de
individuos. Describir la localización relativa de un dato específico en relación con el
resto de la muestra.

 Forma: Asimetría / Apuntamiento o curtosis


Informa respecto de la distribución de los datos, considerando su representación
gráfica. Indican la forma que toman los datos y cuán cercano están estos de la
distribución normal o campana de Gauss.
La distribución normal tiene forma de campana simétrica donde la punta de la curva
representa la media y la cantidad de datos a la izquierda de la media es la misma que
hacia la derecha.
Medidas de Posición
Medidas de Tendencia Central
Medidas que buscan posiciones (valores) con respecto a los cuales
los datos muestran tendencia a agruparse.

Las medidas de tendencia central, que por lo común se emplean:

• Media aritmética (también sólo media o promedio simple)


• Mediana
• Moda

17
Medidas de Tendencia Central
MEDIA x 
Media (‘mean’):
La media aritmética (promedio) es la medida de tendencia central más
utilizada.


Es el promedio aritmético de una distribución o la suma de los valores
dividido por el tamaño muestral.

Es una medida solamente aplicable a mediciones por intervalos o de razón.

Ej: Media de 2,2,3,7 es (2+2+3+7)/4=3,5


Conveniente cuando los datos se concentran simétricamente
con respecto a ese valor.
Muy sensible a valores extremos.

18
Media de una muestra
X
 X
n
donde X indica la suma de todos las X
n es el número total de valores en la muestra

Media de una población


 X
N
 indica la media poblacional.
N es el número total de observaciones en la población

19
Medidas de Tendencia Central MEDIANA
Mediana (‘median’)
~x
 Es el valor céntrico en un conjunto de valores ordenados de menor a
mayor o de mayor a menor.
 Es decir, es un valor que divide a las observaciones en dos grupos con el
mismo número de individuos (percentil 50). Si el número de datos es par,
se elige la media de los dos datos centrales.

 Una forma fácil de localizar la posición del elemento medio para datos no
agrupados es por medio de:

20
Medidas de Tendencia Central MEDIANA
•Es una medida de tendencia central propia de los niveles de medición
ordinal, por intervalos y de razón.
•No es influenciada por valores extremos.
• 50%de las observaciones son mayores que la mediana.
• No necesita ser uno de los valores del conjunto de datos
• Es única para un conjunto de observaciones.

EJ:
Mediana de 1,2,4,5,6,6,8 es 5
Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5
Es conveniente cuando los datos son asimétricos. No es sensible a valores
extremos.
 Mediana de 1,2,4,5,6,6,800 es 5.
¡La media es 117,7!

21
Altura mediana

22
Ejemplo: Suponga que intenta adquirir una casa en un condominio
en una linda comuna de Santiago. El agente de ventas le indicó que
el precio promedio de las casas disponibles en este momento es de
4225 UF.

Si tuviera un presupuesto máximo de 2800UF, podría pensar que


está fuera de sus posibilidades. Sin embargo, al verificar los precios
individuales de las casas podría cambiar de idea. Los precios son
2300UF, 2600UF, 3500UF y 8500UF.

El precio 8500UF está haciendo que la media se incline hacia arriba,


por lo que es un promedio no representativo. Un precio entre 2600
y 3500 es una referencia más representativa. En casos como éste la
mediana proporciona una medida más exacta de la tendencia central

23
Medidas de Tendencia Central
MODA
La Moda (mode): Valor de la observación que aparece con más
frecuencia.

Es el/los valor/es donde la distribución de frecuencia alcanza un


máximo.

La moda es útil en especial al describir los niveles nominal y ordinal


de medición (aunque puede determinarse para todos los niveles de
datos)

Un conjunto de datos puede tener más de una moda o no tener una


moda
25
Medidas de Tendencia Central
MODA
Ejemplo: Una empresa ha desarrollado cinco lociones para baño. En el
diagrama se muestran los resultados de una investigación de mercado
diseñada para determinar qué loción para baño prefieren los
consumidores

La mayor cantidad de
respuestas favoreció
a la llamada
Lamoure, según lo
indica la barra más
alta. Por tanto tal
producto es la moda

26
Usos de media, mediana y moda
Datos poblacionales
La moda puede ser útil como medida descriptiva de un grupo de la población,
aunque sólo si existe una moda claramente perceptible.

La mediana es siempre una medida excelente para representar el nivel típico de los
valores observados, como los índices de salud, de una población. Esto es así
independientemente de la existencia de más de una moda o de que la distribución
de la población sea asimétrica o simétrica.

La media aritmética es excelente como valor representativo de una población,


aunque sólo si la distribución de datos de la población es claramente simétrica. En
datos no simétricos, los valores extremos distorsionarán el valor de la media como
valor representativo.

27
Uso de media, mediana y moda
Datos muestrales

La moda: La moda no es una medida aceptable de posición respecto


de datos muestrales, porque su valor puede variar ampliamente de
una muestra a otra.

La mediana: es mejor que la moda, porque su valor es más estable


entre muestra y muestra.

La media: es la más estable de las tres medidas.

28
Medidas de tendencia central
 La moda es la categoría o puntuación que ocurre con mayor
frecuencia (El valor que más se repite). Se utiliza con cualquier nivel de
medición.

 La mediana es el valor que divide la distribución de los casos


por la mitad (50% de los casos). Refleja la posición intermedia de la
distribución dado que la mitad de los casos están por sobre la mediana y
la otra mitad por debajo. Se utiliza en niveles de medición ordinales y
escalares.

 La media corresponde al promedio aritmético de una


distribución. Corresponde a la suma de las puntuaciones dividido por
el total de casos. Se utiliza solo para niveles de medición escalares.

Potrebbero piacerti anche