Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
INTRODUCCIÓN A LA ESTADÍSTICA:
EVOLUCIÓN
CONCEPTOS BÁSICOS
ETAPAS DEL ANALISIS ESTADISTICO
POBLACIÓN Y MUESTRA
INTRODUCCIÓN
En nuestra primera unidad didáctica comprenderemos el significado de la palabra
estadística, y podremos observar como a través de la historia la utilización de esta
herramienta ha sido fundamental en el desarrollo de diversas actividades, notaremos su
presencia en las distintas disciplinas naturales, sociológicas, económicas, como
tecnológicas. El análisis Estadístico - presente en cada acto humano - puede dotar al
investigador de una estrategia diferencial respecto de otros profesionales. La posibilidad
de mejorar continuamente los procesos repetitivos, debe basarse en respaldos
estadísticos de acuerdo a lo que se espera proyectado hacia el futuro.
OBJETIVOS ESPECÍFICOS
► Que el alumno pueda notar que, a partir de la necesidad de información en distintos
campos, desde hace tiempo existe tanto esmero en unificar sus indicadores y la
interpretación de los valores calculados.
► Que el alumno posea un marco para la elección del tipo de muestreo más adecuado en
una investigación
CONTENIDOS
Los primeros indicios.
Evolución conocida.
Necesidad de información censal.
Teorías probabilísticas
El proceso de muestreo
Población y Muestra
Marco de muestreo
Elección del método de muestreo
Tipos de muestreo probabilístico: probabilístico o no probabilístico
Tipos de muestreo no probabilístico
Error de muestreo
Nivel de confianza
Cálculo del tamaño de muestra para la media
Cálculo del tamaño de muestra para una variable categórica
Esquema de contenidos
Los
Organización
primeros Romanos
política
Censos
indicios
Registro de Compilación
Francia
bautismos, estadísitca de
1500 Inglaterra fallecimientos, recursos
matrimonios nacionales
Predicciones sobre
proporciones de
1600 nacimientos de
varones y mujeres
pirámides. En el mismo Egipto, Ramsés II hizo un censo de las tierras con el objeto de
verificar un nuevo reparto.
También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos
efectuaron censos periódicamente con fines tributarios, sociales (división de tierras) y
militares (cálculo de recursos y hombres disponibles). La investigación histórica revela que
se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y
ponderar la potencia guerrera.
Evolución conocida
Durante los mil años siguientes a la caída del imperio Romano se realizaron muy
pocas operaciones Estadísticas, con la notable excepción de las relaciones de tierras
pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y por Carlomagno en
el 762 DC. Durante el siglo IX se realizaron en Francia algunos censos parciales de siervos.
En Inglaterra, Guillermo el Conquistador recopiló el Domesday Book o libro del Gran
Catastro para el año 1086, un documento de la propiedad, extensión y valor de las tierras
de Inglaterra. Esa obra fue el primer compendio estadístico de Inglaterra.
Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicolás
Copérnico, Galileo, Neper, William Harvey, Sir Francis Bacon y René Descartes, hicieron
grandes aportes al método científico, de tal forma que, cuando se crearon los Estados
Nacionales y surgió como fuerza el comercio internacional existía ya un método capaz de
aplicarse a los datos económicos.
sociales, comercio y poderío militar. Durante el siglo XVII aportó indicaciones más
concretas de métodos de observación y análisis cuantitativo y amplió los campos de la
inferencia y la teoría Estadística.
Los eruditos del siglo XVII demostraron especial interés por la Estadística
Demográfica como resultado de la especulación sobre si la población aumentaba, decrecía
o permanecía estática.
En los tiempos modernos tales métodos fueron resucitados por algunos reyes que
necesitaban conocer las riquezas monetarias y el potencial humano de sus respectivos
países. El primer empleo de los datos estadísticos para fines ajenos a la política estuvo a
cargo de Gaspar Neumann en 1691, un profesor alemán que vivía en Breslau. Este
investigador se propuso destruir la antigua creencia popular de que en los años
terminados en siete moría más gente que en los restantes, y para lograrlo hurgó
pacientemente en los archivos parroquiales de la ciudad. Después de revisar miles de
partidas de defunción pudo demostrar que en tales años no fallecían más personas que en
los demás. Los procedimientos de Neumann fueron conocidos por el astrónomo inglés
Halley, descubridor del cometa que lleva su nombre, quien los aplicó al estudio de la vida
humana. Sus cálculos sirvieron de base para las tablas de mortalidad que hoy utilizan
todas las compañías de seguros.
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
Durante el siglo XVII y principios del XVIII, matemáticos como Bernoulli, Francis
Maseres, Lagrange y Laplace desarrollaron la teoría de probabilidades. No
obstante durante cierto tiempo, la teoría de las probabilidades limitó su
aplicación a los juegos de azar y hasta el siglo XVIII no comenzó a aplicarse a los
grandes problemas científicos.
Jacques Quételect es quien aplica las Estadísticas a las ciencias sociales. Este
interpretó la teoría de la probabilidad para su uso en las ciencias sociales y resolver la
aplicación del principio de promedios y de la variabilidad a los fenómenos sociales.
Quételect fue el primero en realizar la aplicación práctica de todo el método Estadístico,
entonces conocido, a las diversas ramas de la ciencia.
Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la medida de
las relaciones.
Queda entonces claramente establecido que cada vez que citamos estadística
estamos refiriéndonos a un método científico, herramienta de la cual se nutren
varias ciencias.
Esta definición abarca todos los temas que se abordarán en el presente curso y
permite hacernos las siguientes preguntas:
¿Cómo y dónde se obtienen los datos? ¿Trabajamos con todos los datos o con
algunos? ¿Cómo pueden ser los datos? ¿Cómo se organizan? ¿Qué tipos de análisis se
pueden hacer? ¿Cómo interpretamos esos datos?
una adecuada base científica para poder extraer conclusiones válidas sobre la población
de la cual la muestra ha sido obtenida.
En este punto será muy importante el método utilizado para recolectar la muestra,
de manera que ésta represente verdaderamente las características de la población
Recolección de la información
c) Otra forma es realizar encuestas o entrevistas. En este caso no se ejerce control sobre
el comportamiento de las personas que se estudian; se realizan preguntas sobre
creencias, actitudes, conductas y otras características.
Una vez recopilada la información, ésta se vuelca a una planilla de cálculo para
facilitar su procesamiento.
El primer paso en esta etapa será identificar qué tipos de variables están presentes
y en función de cómo se clasifiquen, se organizan y se presentan en tablas de frecuencia,
en tablas de contingencia y se representan gráficamente.
Análisis de la información
Para dar respuesta a esta pregunta, es necesario definir los conceptos de Población
y Muestra. Es de fundamental importancia comenzar el estudio definiendo cuál es la
Población objetivo.
Las poblaciones suelen ser muy numerosas, por lo que es difícil estudiar a todos
sus miembros; además de que esto suele no ser posible, tampoco es necesario. Es como si
se quisiera estudiar la composición química del agua de un río y para ello se intentara
analizar toda el agua que corre por su cauce, cuando solamente se pueden tomar unas
muestras para realizar ese estudio y llegar a conclusiones generalizables con respecto a la
composición química del agua de todo el río.
Marco de muestreo
para producir una muestra representativa de individuos con las características deseadas:
por ejemplo, utilizando procedimientos de marcado de dígitos aleatorios para encuestas
telefónicas
a) Muestreo por azar simple: para seleccionar a las unidades muestrales se emplea
una tabla de números aleatorios o se generan éstos a través de un ordenador. A cada
elemento de la población se le asigna un número que permita identificarlo; luego se
seleccionan los elementos que van a integrar la muestra de tamaño n haciendo coincidir el
número de identificación con los primeros n números aleatorios. La probabilidad que
tiene cada elemento de ser seleccionado es: P(x) = n/N
c) Muestreo por cuotas: Es la técnica más difundida sobre todo en estudios de mercado y
sondeos de opinión. En primer lugar es necesario dividir la población de referencia en
varios estratos definidos por algunas variables de distribución conocida (como el género o
la edad). Posteriormente se calcula el peso proporcional de cada estrato, es decir, la parte
proporcional de población que representan. Finalmente se multiplica cada peso por el
tamaño de n de la muestra para determinar la cuota precisa en cada estrato. Se diferencia
del muestreo estratificado en que una vez determinada la cuota, el investigador es libre
de elegir a los sujetos de la muestra dentro de cada estrato.
d) Muestreo bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y
estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes,
sectas, determinados tipos de enfermos, etc
𝒁𝟐 𝒑 (𝟏−𝒑)
Cálculo del tamaño de muestra para una variable categórica: 𝒏 =
𝒆𝟐
Observando las fórmulas puede darse cuenta que a medida que disminuye el error
muestral y/o aumenta el nivel de confiabilidad, el tamaño de muestra es mayor.
Se quiere estudiar cuáles son los factores que más han incidido en los accidentes de
trabajo en el sector de la construcción durante el año 2015 en la ciudad de Mar del Plata.
Población: todos los trabajadores afiliados en el sindicato de la construcción en Mar del
Plata durante el año 2015.
Unidad de muestreo: el trabajador
Extensión: ciudad de Mar del Plata
Tiempo: año 2015
Marco de muestreo: el listado de todos los trabajadores afiliados al sindicato durante
el año 2015 en la ciudad de Mar del Plata
Tamaño de muestra: para calcular el tamaño de muestra, se utiliza la fórmula para una
variable categórica, dado el objetivo del estudio. Se utiliza un nivel de confianza del
95% y se acepta un error muestral del 5%. De acuerdo a esto, el tamaño adecuado será
de 385 trabajadores
𝒁𝟐 𝒑 (𝟏−𝒑) 𝟏.𝟗𝟔𝟐 𝒙 𝟎.𝟓 𝒙 𝟎.𝟓
𝒏= = = 𝟑𝟖𝟒. 𝟏𝟔
𝒆𝟐 𝟎.𝟎𝟓𝟐
a) Muestreo por azar: como criterio para la selección al azar de los trabajadores
puede utilizarse el número de afiliado al sindicato. Utilizando una tabla de
números aleatorios (que puede encontrarse en libros de estadística o pueden
generarse con una planilla de cálculo), si la muestra (n) va a ser de 385 individuos,
se seleccionan del marco de muestreo los 385 primeros trabajadores cuyo número
de afiliado coincidan con los primeros 385 números aleatorios.