Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
FACULTAD DE CIENCIAS
DEPARTAMENTO ACADÉMICO DE MATEMÁTICAS Y
ESTADÍSTICA
Conceptos Básicos
Contenido:
Estadística y probabilidades
Ingeniería Eectrónica
Estadística
Población y muestra
Variables estadísticas
Etapas del proceso estadístico en
la investigación
Profesor:
Edgar Centeno Huamaní
Cusco – Perú
2019
Estadística y probabilidades Semestre 2019-II
Capítulo I
Conceptos básicos
1.2 Estadística.
La palabra estadística a menudo nos trae a la mente imágenes de números apilados en
grandes arreglos y tablas de volúmenes de cifras relativas a nacimientos, muertes, impuestos,
poblaciones, ingresos, deudas, créditos y así sucesivamente.
La Estadística es mucho más que sólo números apilados y gráficas bonitas. Es una ciencia
con tanta antigüedad como la escritura, y es por sí misma auxiliar de todas las demás ciencias.
Los mercados, la medicina, la ingeniería, los gobiernos, etc. se nombran entre los más
destacados clientes de ésta.
La ausencia de ésta conllevaría a un caos generalizado, dejando a los profesionales,
UNSAAC -2- Prof. Edgar Centeno H.
Estadística y probabilidades Semestre 2019-II
administradores y ejecutivos sin información vital a la hora de tomar decisiones en estos tiempos
de incertidumbre.
La Estadística que conocemos hoy en día debe gran parte de su realización a los trabajos
matemáticos de aquellos hombres que desarrollaron la teoría de las probabilidades, con la cual
se adhirió la Estadística a las ciencias formales.
Definición de Estadística más aceptada en la actualidad: “Es la ciencia que se ocupa de
la recolección, organización, resumen, presentación, análisis de datos y la obtención de
inferencias sobre poblaciones utilizando una muestra, así como de obtener conclusiones válidas
y tomar decisiones basados en dichos análisis”. A la Estadística también se le conoce como la
ciencia de los datos”. La estadística se divide en estadística descriptiva y estadística inferencial.
a) Estadística descriptiva.
Se ocupa de la recolección, descripción, visualización y resumen de los datos originados a
partir de los fenómenos en estudio. Los datos pueden ser resumidos numérica o gráficamente.
La estadística descriptiva es el paso inicial en un análisis estadístico el cual concluye con el
proceso de generalización o inferencia sobre la población de donde fueron tomados los datos.
b) Estadística inferencial o inductiva.
Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los
fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para
modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas
inferencias pueden tomar la forma de respuestas a preguntas (prueba de hipótesis), estimaciones
de características numéricas (estimación), pronósticos de futuras observaciones, descripciones de
asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión).
Otras técnicas de modelamiento incluyen el ANOVA, series de tiempo y minería de datos.
1.3 Dato u observación
Los datos son la materia prima de la estadística. Un dato puede ser categórico (cualitativo) o
numérico (cuantitativo). Los datos se pueden obtener de diferentes maneras:
Encuestas (Encuesta sobre calidad de atención en una institución pública).
Experimentos (Determinación de dieta más eficaz para bajar de peso).
Registros (Registros contables, registros económicos, registros meteorológicos, historias
clínicas, etc)
Población (N)
Muestreo
Muestra (n)
b) Muestra
Es una parte de la población cuyos elementos se eligen de modo que sean representativos de
todo el colectivo. En vez de examinar la población entera puede examinarse una muestra con
el propósito de inferir los resultados encontrados, por que el examinar una población puede
resultar no práctica o físicamente imposible.
El proceso de selección de una muestra de tamaño “n” se llama muestreo y el proceso de
inferir resultados se llama inferencia estadística. La confiabilidad de las conclusiones
depende de una buena selección de la muestra. En general hay dos tipos de muestras: Las
muestras probabilísticas y las muestras no probabilísticas. .
Las muestras aleatorias o probabilísticas son aquellas cuyos elementos se seleccionan
siguiendo un criterio probabilístico, mientras que las muestras no aleatorias o no
probabilísticas son aquellas cuyos elementos son elegidas mediante criterios no
probabilísticos.
Muestreo
Probabilístico No probabilístico
Muestreo Aleatorio Simple, que consiste en seleccionar al azar las unidades cuando la
población es homogénea, es decir, todos los elementos tienen la misma posibilidad de ser
incluidos en la muestra.
Muestreo Sistemático, es una variación del muestreo aleatorio simple, en este caso
todos los elementos de la población se enumera en orden y si el tamaño de la muestra es n,
entonces se divide en n partes donde cada parte consta de k unidades, se toma al azar un
elemento del primer grupo y la posición que ocupe ese elemento se repite en los siguientes
grupos.
Muestreo Estratificado, consiste en tomar la muestra aleatoria o sistemática de una
población que está dividida en sub-poblaciones llamadas estratos, es decir, la muestra
también está dividida en estratos.
Muestreo de Conglomerados, es el método de seleccionar unidades de muestreo
complejos.
¿Por qué una muestra en lugar de un censo?
La naturaleza destructiva de ciertas pruebas.
En un censo, los catadores de vino para evaluar una vendimia tendrían que consumir toda la
producción y no quedaría producto disponible para la venta. Del mismo modo, las
siderúrgicas para asegurarse que sus productos cumplan con los estándares mínimos tendrían
que someter toda su producción de placas de acero y similares a pruebas de resistencia a la
tensión y en ese caso no quedaría ningún producto para su venta o uso.
La imposibilidad física de revisar todos lo integrantes de la población.
Las poblaciones de peces, aves, serpientes, mosquitos y similares son grandes y están en
movimiento constante, los seres nacen y mueren. En ese caso es conveniente usar el
muestreo.
El costo de estudiar a todos los integrantes de una población,
frecuentemente es prohibitivo y en ocasiones se necesitaría mucho tiempo.
Una empresa que realiza encuestas de opinión pública, al averiguar la intención de voto en el
Perú para las elecciones presidenciales, en general entrevista a menos de 2000 electores
hábiles de los aproximadamente 20 millones de votantes que hay en el país en uno o dos
días, si el costo por encuesta es de 30 soles entonces el gasto total es aproximadamente 60
mil soles. Si se decide entrevistar a toda la población de electores hábiles el costo sería
aproximadamente 600 millones de soles, que por supuesto nadie estaría en condiciones de
asumirlo. Del mismo modo si la empresa utiliza al mismo personal de entrevistadores
durante los siete días de la semana, se necesitarían aproximadamente 40 años para
entrevistar a toda la población de electores, inclusive si se incrementa los encuestadores
generaría más gasto y no tendría sentido ni justificación tal costo.
En la práctica una muestra puede ser más precisa que un censo.
Si bien un censo en teoría es más preciso que una muestra, en la práctica estamos limitados
por las restricciones mencionadas anteriormente, por lo que es más práctico usar una
muestra por la rapidez en la obtención de resultados y ésta puede ser más precisa si
reducimos el error no muestral, por lo que podemos dedicar más tiempo y atención al
instrumento de medición y a los procedimientos relacionados.
ii) Nominal
En este caso los valores de la variable no pueden ser sometidos a un criterio de
orden.
Ejemplo:
X = Género.
1. Varón
2. Mujer
X = Estados civil.
1. Soltero
2. Casado
3. Divorciado
4. Viudo
X = ¿Usted fuma?
UNSAAC -6- Prof. Edgar Centeno H.
Estadística y probabilidades Semestre 2019-II
1. Si
2. No
b) Variables cuantitativas
Son variables que se expresan mediante cantidades numéricas, provienen de conteos y
mediciones. Los resultados de las observaciones se denomina valores y se designan por
sus correspondientes letras minúsculas x1, x2,…; y1,y2, … Dependiendo de los valores
que puedan presentar, las variables cuantitativas pueden ser:
i) Discretas
Son variables que toman valores aislados, es decir no admiten valores intermedios
entre dos valores específicos. Sus valores son números enteros y generalmente
provienen de conteos. El número de valores diferentes que puede asumir es finito
o infinito numerable.
Ejemplo:
X = Número de hijos.
X = Número de asignaturas matriculados en el presente semestre.
X = Créditos aprobados en el semestre anterior.
ii) Continuas
Son variables que pueden tomar cualquiera de los infinitos valores dentro de uno o
varios intervalos de la recta real. Es decir entre dos valores son posibles infinitos
valores intermedios.
Ejemplo:
X = Peso de un paciente (en Kg).
X = Estatura de un alumno (en m).
X = Nivel de hemoglobina (en gr/dL)
X = Tiempo empleado en completar una tarea orientada a evaluar la
coordinación motriz (en min.)
1.6 Escalas de medida
Desde el punto de vista estadístico, puede ser de importancia la siguiente clasificación que
hace referencia a las propiedades métricas de las escalas. Los datos u observaciones pueden
clasificarse bajo las siguientes escalas:
a) Escala nominal. En este caso, la información se clasifica en categorías no numéricas
mutuamente excluyentes entre las que no se puede establecer ninguna relación de orden.
Por ejemplo, género (varón, mujer), nacionalidad de un turista que visita Cusco, tipo de
sangre y religión.
b) Escala ordinal. Si a partir de la información disponible se puede establecer algún tipo de
orden, diremos que la escala es ordinal, es decir una escala ordinal coloca las medidas en
categorías, cada una de las cuales indica un nivel distinto respecto a un atributo que se está
midiendo. Por ejemplo, grado académico (bachiller, magister, doctor), calificación por letras
A, B, C y AD que indican los niveles alcanzados, grados de una I.E. (primero, segundo,
tercero, etc.), evaluación de un profesor de la UNSAAC (insuficiente, aceptable, bueno y
excelente), etc.
c) Escala de intervalos. Se presenta cuando se puede cuantificar numéricamente la distancia
UNSAAC -7- Prof. Edgar Centeno H.
Estadística y probabilidades Semestre 2019-II
existente entre dos observaciones cualesquiera. Una escala de intervalo no tiene un cero
absoluto (valor que indica ausencia de lo que se quiere medir) sino que éste será relativo.
Por ejemplo, temperatura, coeficiente intelectual, año de nacimiento, etc.
d) Escala de razón. En este tipo de escalas, además de poder cuantificar numéricamente la
distancia existente entre dos observaciones cualesquiera, es posible fijar un punto de origen
que indique un cero absoluto que significa “ninguno”. Con datos medidos en una escala de
razón podemos determinar cuántas veces es mayor una medida que otra. Por ejemplo,
salario, producción, peso, estatura, etc.