Sei sulla pagina 1di 15

EVIDENCIA DE APRENDIZAJE.

Reporte estudio
estadístico
UNIDAD 3. Muestreo, Medidas de tendencia
central y de dispersión
Este trabajo tiene como objetivo reportar el estudio estadístico Realizado en El curso
“Estadística Básica” en donde se:
Dara a conocer las características metodológicas de mi base de datos (realizada en
base a SIESVIM). Mostrar los cálculos realizados para la obtención de dicha
información, en base a el indicador y periodo de año.
Exponer los conceptos Básicos de muestreo, Muestreo probabilístico o Muestreo
aleatorio simple, Muestreo aleatorio sistemático, Muestreo aleatorio estratificado y
Muestreo aleatorio por conglomerados.
Métodos de muestreo no probabilísticos, Muestreo por cuotas, Muestreo intencional
o de conveniencia, Bola de nieve y Muestreo Discrecional.
Además de los conceptos “Medidas de Tendencias Central y Dispersión” MEDIA,
MEDIANA MODA, VARIANZA y DESVIACION ESTANDAR y como se
implementaron dichos conceptos para la realización de los mismos.

Apartado 1. Conceptos básicos de Muestreo.

Conceptos básicos de Muestreo.


Muestreo probabilístico: Es aquel en que cada individuo tenga las mismas
oportunidades de ser seleccionado.
Muestreo aleatorio simple: En esta técnica, cada miembro de la población tiene la
misma probabilidad de ser seleccionado como sujeto. Todo el proceso de toma de
muestras se realiza en un paso, en donde cada sujeto es seleccionado
independientemente de los otros miembros de la población.
 Es útil cuando las poblaciones son pequeñas y, por lo tanto, se cuenta
con listados de todos los sujetos. Además de que se utiliza
ampliamente en los estudios experimentales.
Muestreo aleatorio sistemático: El muestreo sistemático es una técnica de
muestreo aleatorio que los investigadores eligen con frecuencia por su sencillez y
calidad regular. El procedimiento del muestreo aleatorio sistemático es muy fácil y
se puede hacer manualmente. Los resultados son representativos de la población
a menos que se repitan ciertas características de la población por cada enésimo
individuo, lo que es muy poco probable.
El proceso de obtención de la muestra sistemática es muy similar a una progresión
aritmética.
Número de inicio:
El investigador selecciona un número entero que debe ser menor al número total
de individuos en la población. Este número entero corresponderá al primer sujeto.
Intervalo:
El investigador elige otro número entero que servirá como la diferencia constante
entre dos números consecutivos en la progresión.
El número entero se selecciona típicamente de modo que el investigador obtenga
el tamaño de la muestra correcto. (Explorable.com, 2009)
 Es útil cuando es imposible o poco práctico utilizar un muestreo
aleatorio simple.

Muestreo aleatorio estratificado: Es una técnica en donde se divide a toda la


población en diferentes subgrupos o estratos. Luego, selecciona aleatoriamente a
los sujetos finales de los diferentes estratos en forma proporcional.

 Es útil cuando el investigador desea resaltar un subgrupo específico


dentro de la población. Esta técnica es útil porque garantiza la
presencia del subgrupo clave dentro de la muestra.
Muestreo aleatorio por conglomerados: En el muestreo por conglomerados, en
lugar de seleccionar a todos los sujetos de la población, el investigador realiza varios
pasos para reunir su muestra de la población.
 Es útil en la investigación de mercados.
Métodos de muestreo no probabilísticos: Es aquel en que las muestras que se
recogen no dan las mismas oportunidades a todos los individuos de ser elegidos.
Muestreo por cuotas: Técnica de muestreo no probabilístico en donde la muestra
reunida tiene la misma proporción de individuos que toda la población con respecto
al fenómeno enfocado, las características o los rasgos conocidos.
 Es útil cuando el investigador tiene como objetivo investigar una
característica o rasgo de un determinado subgrupo.
Muestreo intencional o de conveniencia: Consiste en que las muestras son
seleccionadas porque son accesibles para el investigador. Los sujetos son elegidos
simplemente porque son fáciles de reclutar.
 Es útil no sólo porque es fácil de usar, sino porque también tiene otras
ventajas para la investigación.
En Pruebas Piloto, se suele utilizar ya que permite al investigador
obtener los datos básicos y las tendencias con respecto a su estudio,
sin las complicaciones del uso de una muestra aleatoria.
Bola de nieve: Técnica de muestreo no probabilístico utilizada por los
investigadores para identificar a los sujetos potenciales en estudios en donde los
sujetos son difíciles de encontrar. Además, se hace apoyo de los sujetos para atraer
a más sujetos relacionados con la investigación.
 Es útil si la muestra para el estudio es muy rara o si está limitada a un
subgrupo muy pequeño de la población.
Muestreo Discrecional: Técnica de muestreo donde el investigador selecciona las
unidades que serán muestra en base a su conocimiento y juicio profesional.
 Es útil cuando un número limitado de individuos posee el rasgo de
interés. Es la única técnica viable para obtener información de un grupo
muy específico. También es posible utilizar el muestreo discrecional si
el investigador conoce a un profesional o autoridad fiable que él cree
que es capaz de reunir una muestra representativa.

Apartado 2. La definición de la Muestra de mi base de datos.


La definición de la Muestra de mi base de datos

Nota: La información citada a partir de esta aparatado es transcrita de la


base de datos proporcionada por el INEGI de nombre SIESVIM.
(https://sc.inegi.org.mx/SIESVIM1/Asignador?ruta=/sievcm/Documentos/&nombre
Archivo=Boletin%20Difusion%20SIESVIM.pdf
Ficha del metadato del indicador:
https://sc.inegi.org.mx/SIESVIM1/paginas/consultas/inicio.jsf
(solo se puede obtener desde la base de datos en la sección metadato)
Procedimiento de cálculo del indicador:
https://sc.inegi.org.mx/SIESVIM1/Asignador?ruta=/sievcm/FichasMetadatos/
&nombreArchivo=DI_241.PDF
Aspectos conceptuales: Las Ficha de metadato del indicador y Ficha de metadato
de la fuente de información, son documentos que permiten especificar las
características conceptuales y metodológicas de las mediciones y la fuente de
origen. Aportan elementos que facilitan el análisis de la información, contribuyendo
a un mejor entendimiento y uso apropiado de los datos.
Ficha de metadato del indicador
Características de la muestra: Desde el SIESVIM se da a conocer el
Procedimiento de cálculo del indicador el cual permitirá a usuarios expertos en
bases de datos o cuyo interés sea el procesamiento directo de la información,
comprender o replicar la generación de los indicadores.
Nombre del indicador: Población total
Descripción: Muestra el número de mujeres y hombres en el periodo de referencia.
El indicador permite conocer el número de mujeres y hombres que conforman un
conjunto de población.
Ámbito Sectorial: Gobernación.
Programa al que responde: No aplica.
Unidad de medida: Número absoluto.
Periodicidad: 1990, 1995, 2000, 2005, 2010, 2015.
Frecuencia: Decenal, quinquenal.
Desglose geográfico: Nacional, Entidad federativa.
Variables de desglose: Sexo, grupos de edad, condición de habla de lengua
indígena, tamaño de localidad.
Estatus de información del valor del indicador: Definitiva.
Evento: Conteos de Población y Vivienda Censos de Población y Vivienda
Encuesta Inter-censal 2015.
Nota de cálculo: Los Censos y Conteos de Población y Vivienda proporcionan
información sobre toda la población del país, con desagregación geográfica a nivel
municipal, por lo que constituyen la fuente más completa y consolidada para estimar
el indicador. El valor del indicador para el año 2015 se obtiene de la Encuesta inter-
censal, la cual tiene representatividad a nivel entidad federativa y municipio.
Procedimiento de cálculo
Nombre de la Institución responsable del cálculo: Instituto Nacional de
Estadística y Geografía (INEGI)
Procedimiento del cálculo interior
Nombre del indicador: Defunciones por homicidio según sexo
Fuente de información: Estadísticas vitales de mortalidad
Periodo de la fuente de información utilizada para el cálculo del indicador:
1990–2016
Temporalidad o año de referencia de la fuente: Año de registro de la defunción
Pregunta(s) utilizada(s)
Características de la defunción:
 Causa básica de defunción (código CIE)
 Tipo de muerte accidental o violenta (presunto)
 Lugar de ocurrencia de la lesión

Fórmula de cálculo: 𝐷𝐻 = ∑𝐷𝐻𝑘


𝑘

Donde:
𝐷𝐻 = 𝐷𝑒𝑓𝑢𝑛𝑐𝑖𝑜𝑛𝑒𝑠 𝑝𝑜𝑟 ℎ𝑜𝑚𝑖𝑐𝑖𝑑𝑖𝑜
𝐷𝐻𝑘 = 𝐷𝑒𝑓𝑢𝑛𝑐𝑖𝑜𝑛𝑒𝑠 𝑝𝑜𝑟 ℎ𝑜𝑚𝑖𝑐𝑖𝑑𝑖𝑜 𝑑𝑒 𝑠𝑒𝑥𝑜 𝑘
𝐶𝑜𝑛 𝑘 = 𝑚𝑢𝑗𝑒𝑟𝑒𝑠, ℎ𝑜𝑚𝑏𝑟𝑒𝑠, 𝑛𝑜 𝑒𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑎𝑑𝑜

Proceso de generación:
Se contabilizaron las defunciones que ocurrieron por homicidio y

cuya causa básica de defunción fue de la causa 960 a la 968 para

la CIE-9; o de la causa X85 a la X99 y de la Y00 a la Y09 para la

CIE-10.

Para el lugar de ocurrencia de la lesión se manejan los siguientes

tipos: vivienda particular; vía pública (calles y carreteras); área

comercial, de servicios, industrial, granja o trabajo; otro lugar

(institución residencial, escuelas, áreas de deporte y atletismo,

así como otro lugar especificado); y lugar no especificado.

El medio empleado en la lesión está determinado a partir de la

causa de defunción del código CIE, de acuerdo con la siguiente

agrupación:

 Drogas, medicamentos y sustancias biológicas y químicas (961x, 9620, 9621, 9622, 9629
para la CIE-9; X85a X90 para la CIE-10)
 Ahorcamiento, estrangulamiento y sofocación (963x para la CIE 9; X91 para la CIE-10)
 Ahogamiento y sumersión (964x para la CIE-9; X92 para la CIE-10)
 Arma de fuego (9650, 9651, 9652, 9653, 9654 para la CIE9; X93 a X95 para la CIE-10)
 Humo, fuego y llamas (9655, 9656, 9657, 9658, 9659, 9680, 9683 para la CIE-9; X96 a X98
para la CIE-10).
 Objeto cortante (966x para la CIE-9; X99 para la CIE-10)
 Objeto romo o sin filo (9682 de la CIE-9; Y00 para la CIE10)
 Empujón de lugar elevado o delante de objeto en movimiento o por colisión de vehículo de
motor (9681 para la CIE-9; Y01 a Y03 para la CIE-10)
 Agresión con fuerza corporal o agresión sexual con fuerza corporal (9600, 9601 para la CIE-
9; Y04 a Y05 para la CIE10)
 Negligencia y abandono y otros síndromes de maltrato (9670, 9671, 9679, 9684 para la CIE-
9; Y06 a Y07 para la CIE-10)
 Otros medios (9688 para la CIE-9; Y08 para la CIE-10)
 Medios no especificados (9689 para la CIE-9; Y09 para la CIE-10)

Tratamiento de no especificados: Para el cálculo de este indicador se consideran los datos para

los cuales no se especificó el sexo, la edad, el lugar de


ocurrencia y el medio empleado en la lesión.

Consideraciones importantes:

La variable de desagregación geográfica refiere al área

geográfica en donde ocurrió la defunción; mientras que la

variable de tiempo hace referencia al año de registro de la

defunción.

Para el total nacional se consideraron las defunciones ocurridas

en el extranjero.

La edad de las personas fallecidas se agrupó de la siguiente

manera:

 Menores de un año.
 De 1 a 4 años
 De 5 a 84 años (en grupos quinquenales)
 De 85 años o más
 No especificada

Apartado 3. Medidas de Tendencia Central

Definición de los conceptos de las Medidas de Tendencias Central y Dispersión


Concepto Definición
La media de un conjunto de datos es una
medida de posición central. La definimos como el
valor característico de la serie de datos resultado
MEDIA
de la suma de todas las observaciones dividido
por el número total de datos.

La mediana o mediana estadística, es el


elemento de un conjunto de datos ordenados
que deja a izquierda y derecha la mitad de
valores.
MEDIANA
Si el conjunto de datos no está ordenado,
la mediana es el valor del conjunto tal que el 50%
de los elementos son menores o iguales y el otro
50% mayores o iguales.
La moda es una medida de tendencia central que
MODA indica el valor que más se repite en un grupo de
números.
La varianza mide la mayor o menor dispersión de
los valores de la variable respecto a la media
VARIANZA
aritmética. Siempre es mayor o igual a cero y
mejor que el infinito.
La desviación estándar muestra qué tan alejado
DESVIACION está un dato del valor de la media aritmética, es
ESTANDAR decir, la diferencia que hay entre un dato y la
madia aritmética.

Ejercicio de Medidas de Tendencia Central y Dispersión


1,519 1,534 1,623 1,533 1,476 1,525 1,460 1,370 1,147
1,411 1,284 1,282 1,280 1,316 1,206 1,297 1,298 1,083
1,425 1,925 2,418 2,693 2,764 2,648 2,408 2,383 2,813

Solución intervalo de clases Marca de Frecuencia


frecuencia Marca de clase
absoluta x
No.datos 27 Clase lim inferior lim superior clase absoluta acumulada Frecuencia Absoluta
V máx 2,813 1 1082 1428 1255 12 12 15060
V min 1,083 2 1429 1775 1602 7 19 11214
Rango 1,730 3 1776 2122 1949 1 20 1949
No.de intervalos 5.72350042 5 4 2123 2469 2296 3 23 6888
Amplitud de Clase 346 5 2470 2816 2643 4 27 10572
Diferencia 1 Suma 27 45683
Media 1691.96296
Clase
Mediana 2122 Calculo de la Moda Modal
Media Geométrica 14.7630462
Moda 1294.92308 1 Li Límite Inferior de la Clase Modal 1082 Mediana
Varianza 5360778.46
Desviación Estándar 2315.3355 2 Fl Frecuencia absoluta de Clase Modal 12
m
Fi-1 Frecuencia Absoluta inmediatamente inferior a la clase
3 modal 4

4 Fi+1 Frecuencia Absoluta inmediatamente posterior a la clase modal 7

5 ai amplitud de clase 346

6 8
0.61538462
13

7
1294.92308

Mediana Datos Agrupados

Li Límite inferior de la clase donde se encuentra la mediana 1776

N Es la suma de las frecuencias absolutas 20 e


2

Fi-1 es la frecuencia acumulada anterior a la clase mediana 19


ai Amplitud de clase 346

Fl Frecuencia Absoluta de la clase media 1

2122

Media Media aritmética por datos agrupados

N= Numero de datos 27

∑ Xi*Fi 45683
1691.96296

Varianza para datos agrupados por intervalos intervalo de clases

Y Clase lim inferior lim superior Fi xi fi*xi (xi- )2


Desviación estandar 1 1082 1428 12 1796 21552 429607.42 5155289.
2 1429 1775 7 2316.5 16215.5 5366172.25 37563205
3 1776 2122 1 2837 2837 8048569 80485
4 2123 2469 3 3357.5 10072.5 11272806.3 33818418
5 2470 2816 4 3878 15512 15038884 601555

27 66189 1447410

5360778.46

Nota para realizar la varianza me base en este video: https://www.youtube.com/watch?v=o1PHntekmJI

2315.335497
Media Geométrica

La media geométrica (MG) de un


conjunto de números estrictamente
positivos (X1, X2,…,XN) es la raíz
N-ésima del producto de
los N elementos.

Frecuencia
Intervalo Porcentual
1 44.44

14.76304616 2 25.92
3 3.7
4 11.11
70126132.669401600000000000% 5 14.81
En conclusión, Este análisis estadístico, fue de gran ayuda para analizar los
datos que obtuvimos por medio de nuestra base de datos, el saber cómo
identificar las medidas de tendencia central y ponerlas en práctica fue muy
gratificante.
Además de que es muy importante conocer los tipos de muestreo que existen y
cual de todos estos nos servirá de forma eficaz a la hora de establecer la base de
datos.

Referencia

Referencias: Explorable.com (2009). Muestreo discrecional. Recuperado el 9 de


Marzo de 2018, Obtenido de
Explorable.com: https://explorable.com/es/muestreo-discrecional
Martinez, M. (3 abril 2011). CALCULO DE MEDIDAS DE TENDENCIA CENTRAL
PARA DATOS AGRUPADOS PARTE 1. [Archivo de video]. Recuperado de
https://www.youtube.com/watch?v=tCKGZ8FXZ94

Martinez, M. (3 abril 2011). CALCULO DE MEDIDAS DE TENDENCIA CENTRAL


PARA DATOS AGRUPADOS PARTE 2. [Archivo de video]. Recuperado de
https://www.youtube.com/watch?v=g-1-3nUgAJQ
MUESTREO. Marzo 5 del 2018, de UnaDM Sitio
web:https://unadmexico.blackboard.com/courses/1/SP-SEBA-1801-B1-
004/db/_7733452_1/elmuestreo.pdf
SIESVIM. (s.f.). Administrador de Contenidos. Recuperado el 9 de Marzo de 2018,
de https://sc.inegi.org.mx/SIESVIM1/paginas/consultas/inicio.jsf
SIESVIM. (s.f.). Sistema Integrado de Estadísticas sobre Violencia contra las
Mujeres. Recuperado el9 de Marzo de 2018, de
https://sc.inegi.org.mx/SIESVIM1/Asignador?ruta=/sievcm/Documentos/&nombreA
rchivo=Boletin%20Difusion%20SIESVIM.pdf
UnADM. (2018). Unidad 3: Muestreo, Medidas de tendencia central y de
dispersión. Marzo 16 del 2018, de UnADM Sitio web:
https://unadmexico.blackboard.com/bbcswebdav/institution/DCSA/BLOQUE1/AET/
01/AEBA_2018_01/Contenidos%20PDF/EBA%20PDF/U3/Unidad%203.%20Muest
reo%2C%20medidas%20de%20tendencia%20central%20y%20de%20dispersi%E
F%BF%BDn.pdf

Potrebbero piacerti anche