Sei sulla pagina 1di 91

Tema 1: La Estadística: importancia, organización

y presentación de datos
Introducción
Hoy en día la estadística es de suma aplicación en nuestra vida cotidiana,
ya que esta ciencia posee instrumentos que nos ayudan en nuestro
desempeño profesional, un ejemplo de esta es la organización,
presentación e interpretación de resultados que es lo óptimo para la toma
de decisiones.
En esta primera semana se analiza sobre la definición e importancia de la
Ciencia Estadística, así como su objeto y objetivos de estudio.
Haremos uso de la nomenclatura Estadística, clasificación de variables y la
aplicación de los métodos de recolección de datos.
Estudiaremos la organización y presentación de datos, donde
clasificaremos datos primarios y secundarios para presentarlos en cuadros y
gráficos, construyendo e interpretando distribuciones de frecuencias de
acuerdo a la naturaleza de la variable, ya que esta puede ser de tipo
cualitativo o cuantitativo y dentro de esta clasificación consideramos a las
variables cualitativas y cuantitativas.

Aprendizajes esperados
CAPACIDADES
 Define a la Ciencia Estadística.
 Explica la importancia de la Estadística descriptiva e inferencial.
 Clasifica variables relacionados con casos estadísticos.
 Clasifica datos primarios y secundarios para presentarlos en cuadros y
gráficos
 Construye e interpreta distribuciones de frecuencias y gráficos
estadísticos.

ACTITUDES
 Demuestra interés en los conocimientos de los conceptos fundamentales
del desarrollo personal potenciando fortalezas, mejorando debilidades y
otros aspectos, a través de las tutorías virtuales.
 Es ordenado en el desarrollo de casos Estadísticos.
 Muestra interés por la validez y confiabilidad de los instrumentos de
recolección de datos.
 Participa activamente en las tareas asignadas cumpliendo el cronograma
establecido.
 Mapa conceptual referido al tema

 Te invito a visualizar el mapa conceptual de la primera semana

1.1. Introducción a la Ciencia Estadística


1.1.1 Definición de la Estadística descriptiva e
Inferencial

a) Estadística descriptiva:
Es la rama que se encarga de describir, analizar una serie de datos
y extraer conclusiones sobre el comportamiento de estas. Los
gráficos, tablas, diagramas y cálculos descriptivos nos ayudan a
mostrar los datos de manera más clara y elocuente.

b) Estadística inferencial:
Es la rama que implica generalizaciones y afirmaciones con
respecto a la probabilidad de su validez.
1.1.2 Importancia
No existe actividad humana en que se deje de usar la Estadística, las
decisiones más importantes en nuestra vida se toman con ayuda de esta
ciencia. La importancia en el área científica es porque:
 Realiza una descripción más exacta.
 Permite resumir los resultados de manera significativa y cómoda.
 Nos permite obtener conclusiones generales y específicas.

 1.2. Objeto y objetivos de estudio de la


Estadística

El objetivo básico de la estadística es hacer inferencia acerca de una
población con basea la información contenida en una muestra, ¿qué
significa esto?
 Inferir significa inducir una cosa de otra, llevar consigo, conducir a un
resultado.
 Es decir se pretende establecer inferencia acerca de una población,
entendiendo a la población como un conjunto de individuos,
organismos o entes inanimados de los cuales queremos conocer alguna
o algunas características para que nos ayuden a tomar una decisión u
obtener alguna conclusión de suma importancia, y nada sabemos
sobrela distribución, existencia, ubicación, valor de esta o estas
características que nos interesa saber. Guerra,C.; Menéndez,E. (2003)
 1.3. Nomenclatura Estadística

 a) Medición:
 La medición es un proceso de asignación de números u otros signos a
las características de los objetos, de acuerdo con ciertas reglas
especificadas con anticipación.
 b) Población:
 Es el Conjunto de todos los elementos que comparten un grupo común
de características y forman un universo para el propósito del
problema de investigación educativa.
 c) Muestra:
 Es una parte, un subgrupo de elementos de la población que se
selecciona para participar en el estudio. Cuando la población es muy
grande, es decir tiene cientos o miles de elementos o cuando los
medios y el tiempo son limitados, la investigación se conduce sólo por
la muestra.
 d) Dato
 Es una representación simbólica de un atributo. Los datos
describen hechos empíricos, sucesos y entidades. Los datos pueden
ser constantes o variables.
 e) Constantes
 Es un dato cuyo valor no puede cambiar durante la ejecución de la
investigación. Recibe un valor en el momento de la recolección y este
permanece inalterado durante toda la investigación.
 f) Variables
 Es una palabra que representa a aquello que varía o que está sujeto a
algún tipo de cambio. Se trata de algo que se caracteriza por ser
inestable, inconstante y mudable.
1.4. Clasificación de variables

a) Variables cualitativas: Son las variables que expresan distintas


cualidades, características o modalidad. Cada modalidad que se presenta
se denomina atributo o categoría. Las variables cualitativas pueden ser
dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no,
hombre y mujer o son politómicas cuando pueden adquirir tres o más
valores.
b) Variables cuantitativas: Son las variables que se expresan
mediante cantidades numéricas. Las variables cuantitativas además
pueden ser:
 Variable discreta: Es la variable que presenta separaciones o
interrupciones en la escala de valores que puede tomar. Estas
separaciones o interrupciones indican la ausencia de valores entre los
distintos valores específicos que la variable pueda asumir. Ejemplo: El
número de hijos (1, 2, 3, 4, 5).
 Variable continua: Es la variable que puede adquirir cualquier valor
dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3
kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,...), o el
salario. Solamente se está limitado por la precisión del aparato medidor,
en teoría permiten que exista un valor entre dos variables.
c) Variables cualitativas Nominal: Presenta modalidades no numéricas
que no admiten un criterio de orden, por ejemplo: sexo, estado civil,
profesión, color de cabello, etc.
d) Variables cualitativas Ordinal: Presenta modalidades no numéricas
que admiten un criterio de orden, por ejemplo: nivel de instrucción, ciclo
académico, cargo administrativo, etc.
e) Variables cuantitativas Intervalo: Son variables numéricas cuyos
valores representan magnitudes y la distancia entre los números de su
escala es igual. Con este tipo de variables podemos realizar comparaciones
de igualdad/desigualdad, establecer un orden dentro de sus valores y
medir la distancia existente entre cada valor de la escala. Las variables de
intervalo carecen de un cero absoluto, por lo que operaciones como la
multiplicación y la división no son realizables. Un ejemplo de este tipo de
variables es la temperatura, ya que podemos decir que la distancia entre
10 y 12 grados es la misma que la existente entre 15 y 17 grados. Lo que no
podemos establecer es que una temperatura de 10 grados equivale a la
mitad de una temperatura de 20 grados.
f) Variables cuantitativas Razón: Las variables de razón poseen las
mismas características de las variables de intervalo, con la diferencia que
cuentan con un cero absoluto; es decir, el valor cero (0) representa la
ausencia total de medida, por lo que se puede realizar cualquier operación
Aritmética (Suma, Resta, Multiplicación y División) y Lógica (Comparación y
ordenamiento). Este tipo de variables permiten el nivel más alto de
medición. Las variables altura, peso, distancia o el salario, son algunos
ejemplos de este tipo de escala de medida.
g) Variables Dependientes: Es aquella que dentro de
una hipótesis representa la consecuencia, el efecto, el fenómeno que se
estudia. Se simboliza con la letra Y. Ejemplo: entre las variables
rendimiento académico y aplicación de métodos, la variable dependiente
es rendimiento académico.
h) Variables Independientes: Es aquella que influye en la variable
dependiente y no depende de otra variable, dentro de una hipótesis. Se
simboliza con la letra X. Ejemplo: entre las variables hiperactividad y falta
de autoestima, la variable autoestima es independiente, ya que explica o
influye en la hiperactividad del niño. (Matus, R.; Hernandez, M. ,2010)
1.5. Método de recolección de datos

Se denomina método a la estrategia concreta e integral para establecer


relación entre el investigador y el objeto o fenómeno bajo estudio para la
obtención de datos de manera coherente para el logro de los objetivos de
la investigación.
Los métodos que más se emplean para recopilar datos en la investigación
descriptiva son el método de la Encuesta y la Observación.
1.6. El cuadro estadístico
a) Tablas para Variables Cualitativas
Nomenclatura usada en la tabla:
Frecuencia absoluta simple (fi) Es el número de veces que se repiten los
valores dentro de los diferentes intervalos en que está dividida la
información.
Frecuencia relativa simple (hi%) Es el valor que resulta al dividir cada una
de las frecuencias absolutas simples entre el número total de datos.

b) Tablas para Variables Cualitativas Discretas

Nomenclatura usada en la tabla:


Frecuencia absoluta acumulada (Fi) Se obtiene sumando y acumulando los
valores de las frecuencias absolutas intervalo por intervalo en orden
ascendente.
N1 = n1
N2 = n1 + n2
N3 = n1 + n2 + n3
Ni = n1 + n2 + n3 +… + ni
Frecuencia relativa acumulada (Hi%) Se obtiene sumando y acumulando
los valores relativos simples intervalo por intervalo en orden ascendente.
H1 = h1
H2 = h1 + h2
H3 = h1 + h2 + h3
Hi = h1 + h2 + h3 + … + hi

c) Tablas para Variables Cualitativas Continuas

1.7 Gráficos estadísticos


a) Diagramas de barras:
Se representan en el eje de ordenadas las modalidades y en abscisas las
frecuencias absolutas o bien, las frecuencias relativas.

b) Gráfico Circular
Se usa para representar la dimensión de las partes de un fenómeno total.
Para su elaboración se utiliza la circunferencia, siendo necesario que los
valores absolutos y/o porcentuales, sean traducidos en GRADOS.

c) Diagrama de Bastones
Las barras deben ser estrechas para representar los valores que toma la
variable pues son discretos.

d) Histograma
Un histograma se construye a partir de la tabla estadística, representando
sobre cada intervalo, un rectángulo que tiene a este segmento como base.
El criterio para calcular la altura de cada rectángulo es el de mantener la
proporcionalidad entre las frecuencias absolutas (o relativas) de cada
intervalo y el área de los mismos.
e) Polígono de frecuencias
El polígono de frecuencias se construye fácilmente si tenemos
representado previamente el histograma, ya que consiste en unir mediante
líneas rectas los puntos del histograma que corresponden a las marcas de
clase. Para representar el polígono de frecuencias en el primer y último
intervalo, suponemos que adyacentes a ellos existen otros intervalos de la
misma amplitud y frecuencia nula, y se unen por una línea recta los puntos
del histograma que corresponden a sus marcas de clase. Obsérvese que de
este modo, el polígono de frecuencias tiene en común con el histograma el
que las áreas de la gráfica sobre un intervalo son idénticas

Preguntas de análisis del tema

Estimado estudiante, hemos revisado los contenidos referentes a la


primera semana, y con el fin de seguir apoyándote en este proceso de
enseñanza, te sugiero que analices y des respuesta a las siguientes
preguntas:
1. ¿Es la Estadística una ciencia?
2. ¿Cuál es la diferencia entre Estadística Descriptiva y
Estadística Inferencial?
3. ¿Cuándo utilizo un gráfico de bastones?

Al respecto para conocer un poco más sobre este tema, y dar respuesta a
las preguntas planteadas a continuación te invitamos a revisar la siguiente
lectura:

"Estadística, rama de las matemáticas que se ocupa de reunir,


organizar y analizar datos numéricos y que ayuda a resolver problemas
como el diseño de experimentos y la toma de decisiones."
Ante todo es un elemento útil, ya que nos permite obtener información
referida a grandes grupos de individuos conociendo los datos de sólo unos
pocos.
Desde los comienzos de la civilización han existido formas sencillas de
estadística, pues ya se utilizaban representaciones gráficas y otros
símbolos en pieles, rocas, palos de madera y paredes de cuevas para
contar el número de personas, animales o ciertas cosas. Hacia el año 3000
a.C. los babilonios usaban ya pequeñas tablillas de arcilla para recopilar
datos tabulados sobre la producción agrícola y de los géneros vendidos o
cambiados mediante trueque. Los egipcios analizaban los datos de la
población y la renta del país mucho antes de construir las pirámides en el
siglo XXXI a.C...

Para continuar leyendo pulsa


AQUÍ:http://www.galeon.com/estadisticautil/quees.htm
Referencias bibliográficas
Anderson, D. (2008). Estadística para Administración
y Economía. México: Editorial Internacional Thomson Editores S.A
El propósito de Estadística para administración y economía es
proporcionar, a los estudiantes una introducción conceptual al campo de la
estadística y de sus aplicaciones. El texto está orientado a las aplicaciones
y ha sido escrito pensando en las necesidades de quienes no son
matemáticos.
Las aplicaciones del análisis de datos y de la metodología estadística son
parte integral de la presentación y organización del material de este libro.
El estudio y el desarrollo de cada técnica se presentan mediante una
aplicación, en donde los resultados estadísticos permiten entender las
decisiones y la solución del problema presentado.
Guerra, C. Menéndez, E. (2003). Estadística. Cuba: Félix Valverde

Matus, R.; Hernandez, M. (2010). Estadística. México: Instituto Politécnico


Nacional

Tomeo Perucha, V (2003). Lecciones de Estadística Descriptiva. Madrid.


Editorial Pearson Educación
El material propuesto está diseñado acorde a una visión esencialmente
práctica, pero que no desdeñe los fundamentos teóricos. Lo que se
pretende es que el estudiante consiga una serie de habilidades y destrezas,
que sirvan para que el mismo pueda analizar los rasgos esenciales de
aquellas características que aparezcan descritas sobre los elementos de un
determinado colectivo y que pudieran ser de su interés.
A partir de esta lógica, lograremos que el estudiante conozca los
fundamentos teóricos y prácticos del análisis estadístico a nivel
descriptivo, y su aplicación a problemas reales del mundo empresarial.

Anterior | Siguiente
Conclusiones

Después de haber analizado el contenido de la primera semana concluimos


que la Estadística es una ciencia formal que estudia la recolección, análisis
e interpretación de datos de una muestra representativa, ya sea para
ayudar en la toma de decisiones o en la vida cotidiana; además cabe
resaltar que se apoya de una amplia nomenclatura como: población,
muestra, variables, entre otros; y que además podemos representar los
datos para un fácil entendimiento en tablas y gráficos, enfatizando la gran
importancia que tiene esta ciencia.

TEMA 2:MEDIDAS ESTADÍSTICAS


Introducción al tema

Una forma de interpretar los datos y analizarla es determinar cómo se


distribuyen, para ello es necesario estudiar las medidas estadísticas; en el
transcurso de esta segunda semana identificaremos las medidas
estadísticas, tales como las de tendencia central que son valores que se
ubican al centro de un conjunto de datos ordenados según su magnitud, en
algunos casos estos valores son conocidos como estadígrafos, teniendo
entre ellos a la media aritmética, la mediana y la moda; además
analizaremos la aplicación de las medidas de posición como los cuartiles,
deciles y percentiles; y por último las medidas de dispersión para cada una
de los tipos de variable (cuantitativo discreto - continuo y en algunos casos
para la variable cualitativa).
Hoy en día las medidas estadísticas son muy utilizadas en todos los campos
profesionales, ya que nos permite analizar con exactitud los distintos
porcentajes que puedan adecuarse a la interpretación en un caso
determinado, Ejm. desde la determinación de una pensión de alimentos
para
los abogados, hasta la determinación del peso promedio en recién nacidos
para profesionales de la salud.
Mapa conceptual referido al tema

Observa detenidamente el siguiente esquema, en el encontrarás de un


“vistazo” de manera sintetizada los principales concepto de la temática
que abordaremos. ¿Qué conceptos o categorías te llaman la atención?

2.1 Medidas Estadísticas

En esta semana estudiaremos tres tipos de medidas Estadísticas:


o Medidas de tendencia Central: Media aritmética o promedio, Mediana y
Moda
o Medidas de posición: Cuarti, Decil y Percentil
o Medidas de dispersión: Rango, Varianza y Desviación estándar

2.2 Promedio o Media aritmética


A) Promedio para datos originales: Se denomina datos
originales a un conjunto de datos de cualquier variable y copiados
de cualquier manera. La fórmula para su cálculo es:

Ejemplo: Los siguientes datos corresponde al ingreso de 8 padres de los


alumnos de ingeniería Informática: 1200, 900, 1250, 1350, 800, 750,
1200,1300. Encontrar el ingreso promedio

El ingreso económico promedio de 8 padres de familia es 1093.75 soles.

B) Promedio para datos tabulados


B.1) Promedio para datos tabulados no agrupados en intervalos
cuando se tiene una variable discreta
B.2) Promedio para datos tabulados agrupados en intervalos cuando
la variable es cuantitativa continua

2.3 Moda para datos originales


B) Moda para Datos Originales
Ejemplo N° 1: Los siguientes datos corresponde a los ingresos económicos
de 10 padres de familia. Encontrar la moda.
970, 930, 860, 1040, 1020, 1380, 1410, 900, 1040, 1240
La moda es: Md = 1040

Ejemplo N° 2:Ingresos económicos de 8 trabajadores. Encontrar la moda


1200, 1050, 1200, 910, 1300, 1550, 1420, 960
Estos datos no tienen moda.

Ejemplo N° 3: corresponde a los pesos de 10 alumnos:


65, 54, 72, 60, 58, 54, 66, 70, 58
Md1 = 54
Md2 = 58
Un conjunto de datos puede tener una moda o más de una moda o
también no tener ninguna moda.

2.3.1 Moda para datos tabulados


C) Moda para datos tabulados no agrupados en intervalos (Variable
Discreta)

Ejemplo: Se tomarán los siguientes datos sobre el número de trabajadores


por empresa:

La Moda será el valor de la variable que corresponde a la máxima


frecuencia absoluta
(n4 =16), en este caso Md = 48
El resultado significa que es más frecuente encontrar empresas con 48
trabajadores.
D) Moda para datos tabulados agrupados en intervalos (Variable
Continua)

Los sueldos o ingresos económicos más frecuente de 62 trabajadores


encuentran alrededor de 1016.06 soles.

2.3.2 Moda para datos cualitativos


E) Moda para datos cualitativos
La moda estará dada por la categoría de la variable que corresponde a la
máxima frecuencia absoluta.
Ejemplo: Tomaremos los datos del siguiente cuadro:
Nivel de instrucción n %
Primaria 2 2.86
Secundaria 11 15.71
Sup. No Universitaria 42 60.00
Sup. Universitaria 15 21.43
Total 70 100.00

La máxima frecuencia es 42, por lo tanto, la moda es la categoría superior


no universitaria, es decir: Md = Sup. No Universitaria
2.4 Mediana para datos originales
Es el valor que divide a la totalidad de datos, ordenados en forma
creciente o decreciente, en dos partes iguales, de tal manera que el 50%
de los datos se encuentren a la izquierda de la mediana y el otro 50% a la
derecha de la mediana. (Anderson, 2008)
La mediana se aplica en lugar del promedio, cuando la variabilidad de los
datos es muy marcada. La mediana también se aplica a datos cualitativos
ordenados de acuerdo a rangos.

A) Mediana para Datos Originales


Se presentan dos casos:
A.1) Cuando el N° de datos es Par
Se ordenan los datos en forma creciente o decreciente y se toma el
promedio de los dos valores del centro.
Ejemplo: Los siguientes datos corresponde a las edades de 10 ingenieros:.
50, 22, 61, 30, 55, 42, 46, 35, 38,28
Ordenamos en forma creciente:
22, 28, 30, 35, 38, 42, 46, 50, 55, 61

El 50% de los ingenieros tienen una edad


máxima de 40 años

A.2)Cuando el N° de datos es Impar


Ejemplo: Los siguientes datos corresponden al nº de trabajadores de 9
empresas :
63, 56, 94, 32, 58, 41, 90, 45, 104
Ordenamos de forma creciente : 32, 41, 45, 56, 58, 63, 90, 94, 104
Se toma el valor del centro: Me = 58
El 50% de empresas tienen un número máximo de 58 trabajadores
2.4.1 Mediana para datos tabulados NO EN
INTERVALOS
2.4.2 Mediana para datos tabulados EN
INTERVALOS
2.4.3 Mediana para datos cualitativos
Es factible obtener la mediana cuando se tiene datos cualitativos,
susceptibles de ordenarse de acuerdo a rangos o categorías. (Tomeo,2003)

Ejemplo: Tomaremos los datos del siguiente


La mediana está dada por la categoría que se encuentra en la misma fila
de Nj. Por lo tanto, la mediana está dada por la categoría Secundaria.

El 50% de los padres de familia de los estudiantes tienen un grado de


instrucción máximo de secundaria

2.5 Cuartiles para datos originales

Son medidas de posición que dividen a la distribución de datos


ordenados, en cuatro partes iguales, de tal manera que:
A).Cuartiles para datos originales

2.5.1 Cuartiles para datos tabulados

A continuación se presenta la fórmula para cuartiles en datos


tabulados
2.6 Deciles
A). Deciles para datos originales
Son medidas de posición que dividen a la distribución de datos,
previamente ordenados, en 10 partes.

El Decil i –ésimo es el valor del dato que ocupa la posición


Si la posición no resulta entera, se hace una interpolación lineal
entre los dos valores correspondientes a las dos observaciones
entre las cuales se encuentre la posición.
Ejemplo
Por tanto el Decil 2 es el dato que ocupa la segunda posición: D2 =
330.
El 20% de los trabajadores tienen un ingreso máximo de 330 soles.

B). Deciles para datos tabulados

Ejemplo:
El 40% de los trabajadores, tienen un ingreso máximo de 902.61 soles.

2.7 Percentiles

2.8 Medidas de dispersión


A). Recorrido o Rango: (R)
Viene a ser la diferencia entre el valor mayor y el valor menor de los
datos, es decir:
Ejm. Si tenemos los dos siguientes valores
R = 1384 – 456 = 928 soles.

B). Varianza: ( σ2 )
Es el promedio de las desviaciones con respecto al promedio elevado al
cuadrado.
La varianza no tiene interpretación.
Varianza para datos originales:

Ejem. Los siguientes datos corresponden a los ingresos económicos por


semana de 12 trabajadores de una empresa
Xi: 600, 650, 200, 710, 300, 550, 420, 460, 450, 540, 850, 225.
Para poder aplicar la fórmula, primero debemos encontrar el promedio y
luego aplicar la fórmula de la varianza.

c. Desviación Estándar: ( σ )
Se define como la raíz cuadrada de la varianza.
Ejemplo: Encontrar la desviación estándar para el caso b.1

La dispersión promedio que existe entre los datos y la media aritmética


es de 186.89 soles.

Tema 3: Introducción a las probabilidades


Introducción

Las probabilidades es el tema introductorio de la Estadística Inferencial,


dejando de lado a la Estadística Descriptiva, si bien las probabilidades
surgen a diario por la incertidumbre son de suma importancia ya que
hacemos uso del razonamiento lógico para predecir con seguridad.
En este contexto, esta tercera semana nos convoca al estudio de las
probabilidades, en donde abordaremos temáticas como: Experimento
aleatorio y determinístico. Analizaremos espacios muestrales, eventos y
sucesos, así como los axiomas y teorema de probabilidad, considerando
además la algebra de eventos y técnicas de conteo.
Haremos énfasis sobre la definición clásica, frecuencia relativa y subjetiva
de la probabilidad, a fin de analizar la probabilidad condicional, conjunta y
los teoremas de probabilidad Total y Teorema de Bayes.
Mapa conceptual

Observa detenidamente el siguiente esquema, en el encontrarás de un


“vistazo” de manera sintetizada los principales concepto de la temática
que abordaremos. ¿Qué conceptos o categorías te llaman la atención?
3.1 Experimento aleatorio y determinístico
Si se realiza un experimento, éste puede tener uno de varios posibles
resultados; si no puede predecirse con seguridad cual ocurrirá, se dice que
el experimento es aleatorio.

Por Ejemplo si lanzas una moneda, cuyo resultado puede ser, caer
cara o caer sello. En este experimento no podemos predecir con
seguridad cuál resultado aparecerá con certeza. Otro experimento
aleatorio es el siguiente: al lanzar un dado, los resultados que se
obtienen pueden ser cualquier número del 1 al 6.

Si un experimento tiene un único resultado posible, que al


realizarlo sabemos que ocurrirá, el experimento se
llamará determinístico.

Por Ejemplo, un experimento determinístico sería extraer una bola de una


que contiene bolas con un sólo color, digamos negras. Si nos fijamos en el
color de la bola extraída sabemos de antemano que es negra.
3.2 Espacio muestral
I. Espacio Muestral
Es el conjunto de todos los posibles resultados de un experimento. Por
Ejemplo, al realizar el experimento de lanzar un dado y observar la cara
que aparece, vemos una serie de resultados posibles y que se representa
por:

S = {1, 2, 3, 4, 5, 6 }

Otro Ejemplo es, si realizamos el experimento; si lanzamos dos monedas al


aire, observamos que los posibles resultados pueden ser (en este caso los
resultados de a dos se agrupan en pares ordenados):

T = { (sello, sello) (sello, cara) (cara, sello) (cara, cara) }

Otro Ejemplo es, si realizamos el experimento; se lanzan dos dados, los


posibles resultados al observar el número de puntos en ambas caras de los
dados es el siguiente espacio muestral:

Más Ejemplos:
Dados los siguientes experimentos:
E1: Lanzar una moneda y observar la cara superior.
E2: Lanzar un dado y observar el número que aparece en la cara superior.
E3: Extraer una bola de una urna que contiene bolas rojas “R” y bolas
verdes “V”.
E4: Designar un delegado de un grupo de 50 personas a través de un
sorteo.
E6: Elegir un punto del intervalo cerrado [0,1]
E7: Observar el tiempo de vida de un T.V. SONY.
E8: verificar el estado de un transistor (0= apagado, 1= prendido).
Indicar su espacio muestral:
Solución:

Evento y suceso
Con base a los experimentos anteriores (lanzar un dado, lanzar
dos monedas y lanzar dos dados), observamos que éstos pueden
tener uno o más resultados, a los cuales se les llama “Eventos” y
que se representan mediante letras mayúsculas.
Por tanto un Evento es un subconjunto de un Espacio Muestral.
(Tomeo, 2003)
Se puede hacer una lista de muchos eventos asociados con un
experimento, algunos con más posibilidad de ocurrir que otros.
Desde el punto de vista de conjuntos, un evento es un subconjunto
de un espacio muestral. Por Ejemplo, en el experimento de tirar un
dado se tiene:
{1} es el evento elemental o evento simple que indica que al
lanzar un dado salga la unidad.
{2, 4,6} es un evento que indica que al lanzar un dado salga
número par.
{1, 2,3} es un evento que indica que al lanzar un dado salga un
número menor que 4
{1, 2, 3, 4, 5, 6} es un evento que indica que al lanzar un dado
salga un número menor que 7
Otro Ejemplo: En el experimento aleatorio lanzar 4 monedas
simultáneamente. Definimos los eventos siguientes:
E1: “Todas las monedas muestran el mismo lado”
E2: “Ocurren por lo menos dos caras”
E3: “Ocurre sello en el tercer lanzamiento”.
3.3 Axiomas y teorema de probabilidad
Ejemplo: Se lanza dos dados. Calcular la probabilidad de:
a) Obtener suma 4.
b) Obtener suma 7.
c) Obtener suma par.
d) Obtener suma mayor que 5.
e) Que el resultado del primer dado sea mayor que el resultado del
segundo?

Sol: El espacio muestral lo podemos obtener a través de un cuadrado de


doble entrada donde S está formado por pares ordenados, en la cual la
primera componente es el resultado del primer dado y la segunda
componente el resultado del segundo dado.
3.4 Definiciones de probabilidad
1. Definición Clásica o A priori
La probabilidad de un evento es la razón entre el número de casos
(sucesos) favorables y el número total de casos (sucesos) posibles del
espacio muestral, siempre y cuando cada uno de los resultados o sucesos
del espacio muestral tiene la misma posibilidad de suceder. Así, la
probabilidad de que ocurre el evento E es:
Dónde: N (E)=nE = cardinal del conjunto E
N(S)=n = cardinal del conjunto S.
Nota: cardinal de un conjunto es el número de elementos que
tiene dicho conjunto.

Observación: las propiedades de la probabilidad por frecuencia relativa


son las mismas que la probabilidad clásica dados en las observaciones
generales de la pág.
Ejemplo: en 20 centros educativos de las diferentes P.P.J.J. de Chiclayo
que forman en total a 16000 alumnos, se detectaron 1900 casos de
tuberculosis. Hallar la probabilidad de encontrar a un alumno tuberculoso
en un colegio determinado.
Sol: sea el evento E: “un alumno tuberculoso en determinado colegio”.

Entonces diremos si escogemos un alumno de un determinado centro


educativo, existe un 11,86% de posibilidades que esté tuberculoso.

3. Probabilidad Subjetiva
La probabilidad es subjetiva cuando en un experimento determinado, la
probabilidad de que un evento A ocurra, tiene un grado de creencia
asignado a la ocurrencia de este evento por un individuo en particular,
pero eso sí, está basado en toda la evidencia a su disposición, con las
siguientes exigencias:
1) P(A) = 0 , representa la certeza de que el evento A no ocurrirá.
2) P(A) = 1, representa la certeza de que el evento A si ocurrirá.
3) 0 ≤ P(A) ≤ 1, representa la certeza de que el evento A, ocurrirá.
Claro es que si la probabilidad es subjetiva de la ocurrencia de un evento
A, para una persona tendrá un determinado valor de acuerdo a las
condiciones o evidencias que dispone. Y para otra persona que tiene de
repente más evidencias, podría asignar a la ocurrencia del evento A otra
probabilidad diferente (un número diferente al anterior).
Ejemplo:
¿Cuál es la probabilidad de que la selección peruana se clasifique al
próximo Mundial de Fútbol?
¿Cuál es la probabilidad de que un profesor en educación pública gane
S/.10000 en el próximo gobierno?
Como pueden observar, son eventos únicos, que no han ocurrido antes. No
hay forma de que se puedan interpretar tales probabilidades como una
frecuencia relativa o como una probabilidad Clásica. Entonces el enfoque
subjetivo de la probabilidad es pues adecuado en la respuesta de las
preguntas últimamente expuestas. (Walpole, 1998)

Observación: las dos primeras definiciones son probabilidades objetivas.


3.5 Algebra de eventos
Simplemente es la misma Álgebra de conjuntos, es decir podemos
combinar eventos para formar nuevos eventos, utilizando las
diferentes operaciones conjunto:
Si denotamos los eventos por A,B,C,D,E,etc.
3.6 Técnicas de conteo
1. Principio aditivo
Si se desea llevar a efecto una actividad, la cuál tiene formas alternativas
para ser realizada, donde la primera de esas alternativas puede ser
realizada de M maneras o formas, la segunda alternativa puede realizarse
de N maneras o formas y la última de las alternativas puede ser realizada
de W maneras o formas, entonces esa actividad puede ser llevada a cabo
de,

M + N + .........+ W maneras o formas


Ejemplos:
1) Una persona desea comprar una lavadora de ropa, para lo cuál ha
pensado que puede seleccionar de entre las marcas Whirpool, Easy y
General Electric, cuando acude a hacer la compra se encuentra que la
lavadora de la marca W se presenta en dos tipos de carga ( 8 u 11
kilogramos), en cuatro colores diferentes y puede ser automática o
semiautomática, mientras que la lavadora de la marca E, se presenta en
tres tipos de carga (8, 11 o 15 kilogramos), en dos colores diferentes y
puede ser automática o semiautomática y la lavadora de la marca GE, se
presenta en solo un tipo de carga, que es de 11 kilogramos, dos colores
diferentes y solo hay semiautomática. ¿Cuántas maneras tiene esta persona
de comprar una lavadora?
Solución:
M = Número de maneras de seleccionar una lavadora Whirpool
N = Número de maneras de seleccionar una lavadora de la marca Easy
W = Número de maneras de seleccionar una lavadora de la marca General
Electric
M = 2 x 4 x 2 = 16 maneras
N = 3 x 2 x 2 = 12 maneras
W = 1 x 2 x 1 = 2 maneras
M + N + W = 16 + 12 + 2 = 30 maneras de seleccionar una lavadora
¿Cómo podemos distinguir cuando hacer uso del principio multiplicativo y
cuando del aditivo?
Es muy simple, cuando se trata de una sola actividad, la cual requiere para
ser llevada a efecto de una serie de pasos, entonces haremos uso del
principio multiplicativo y si la actividad a desarrollar o a ser efectuada
tiene alternativas para ser llevada a cabo, haremos uso del principio
aditivo.

2. Principio Multiplicativo
Si se desea realizar una actividad que consta de r pasos, en donde el
primer paso de la actividad a realizar puede ser llevado a cabo de
N1 maneras o formas, el segundo paso de N2 maneras o formas y el r-ésimo
paso de Nr maneras o formas, entonces esta actividad puede ser llevada a
efecto de;
N1 x N2 x ..........x Nr maneras o formas
El principio multiplicativo implica que cada uno de los pasos de la
actividad deben ser llevados a efecto, uno tras otro.
Ejemplos:
Una persona desea construir su casa, para lo cuál considera que puede
construir los cimientos de su casa de cualquiera de dos maneras (concreto
o block de cemento), mientras que las paredes las puede hacer de adobe,
adobón o ladrillo, el techo puede ser de concreto o lámina galvanizada y
por último los acabados los puede realizar de una sola manera ¿cuántas
maneras tiene esta persona de construir su casa?
Solución
Considerando que r = 4 pasos
N1= maneras de hacer cimientos = 2
N2= maneras de construir paredes = 3
N3= maneras de hacer techos = 2
N4= maneras de hacer acabados = 1
N1 x N2 x N3 x N4 = 2 x 3 x 2 x 1 = 12 maneras de construir la casa
El principio multiplicativo, el aditivo y las técnicas de conteo que
posteriormente se tratarán nos proporcionan todas las maneras o formas
posibles de como se puede llevar a cabo una actividad cualquiera.

3.7 Principios factoriales


a) Permutaciones:
Dado un conjunto finito A, de cardinal , se llaman permutaciones a las
ordenaciones totales que pueden hacerse con los elementos del conjunto
A.
Ejemplo:
- el conjunto unitario {a} sólo puede ordenarse de un modo único.
- el conjunto {a, b} puede ordenarse de dos modos: ab, ba
- el conjunto {a, b, c} puede ordenarse en seis modos: abc, acb, bac, bca,
cab, cba
b) Variaciones:
Dado un conjunto de elementos, se da el nombre de variación a cada una
de las ordenaciones que se pueden formar tomando grupos en elementos
de este conjunto; teniendo en cuenta el orden que toman .
Del Ejemplo anterior tenemos que del conjunto {2, 3, 5, 6, 7, 9} tomamos
3 elementos para formar números diferentes de 3 dígitos (parte a), es
decir tomamos grupos de 3 en 3 elementos, teniendo en cuenta el orden,
dio como resultado por el principio fundamental del conteo

c) Combinaciones:
Una combinación de objetos es aquel acto de juntarlos en donde
no cuenta el orden de colocación de los objetos. Las diversas
combinaciones de objetos difieren entre si por la calidad de los
ingredientes; es decir, dado un conjunto de elementos se pide
cuantos subconjuntos de elementos hay.
Ejemplo: del conjunto A={a, b, c, d}. ¿Cuántos subconjuntos de
3 elementos hay?
Sol: hallamos las combinaciones de 3 elementos (subconjuntos de
3 elementos del conjunto
A) {a, b, c}, {a,b,d}, {a, c, d}, {b, c, d} Luego hay 4
combinaciones.
La dificultad se da si A tiene muchos elementos, para hallar el
número de combinaciones existe el siguiente teorema:

3.6 Teorema de Bayes


Sean A1, A2, A3,……., An , n eventos pertenecientes al espacio
muestral “S” y sea B un evento cualquiera, con P (B) > 0,
entonces se cumple que:

Ejem. En una empresa A se tiene 10 obreros , 18 empleados y 5


ejecutivos. En la sala B , se tiene 13 obreros ,25 empleados y 4 ejecutivos.
En la empresa C, se tiene 8 obreros, 14 empleados y 3 ejecutivos Se elige
una empresa y se extrae un trabajador, el mismo que resulto que era
empleado. Cual es la probabilidad de que el trabajador elegido proceda
de la empresa:
1. A
2. B
3. C
Solución
Simbolizaremos con O, a los obreros; con E, a los empleados y con Ej. a los
ejecutivos. Ahora aplicamos la fórmula:
Como dijera Huntsberger: "La palabra estadística a menudo nos trae a la
mente imágenes de números apilados en grandes arreglos y tablas, de
volúmenes de cifras relativas a nacimientos, muertes, impuestos,
poblaciones, ingresos, deudas, créditos y así sucesivamente. Huntsberger
tiene razón pues al instante de escuchar esta palabra estas son las
imágenes que llegan a nuestra cabeza.

La Estadística es mucho más que sólo números apilados y gráficas bonitas.


Es una ciencia con tanta antigüedad como la escritura, y es por sí misma
auxiliar de todas las demás ciencias. Los mercados, la medicina, la
ingeniería, los gobiernos, etc. Se nombran entre los más destacados
clientes de ésta.

La ausencia de ésta conllevaría a un caos generalizado, dejando a los


administradores y ejecutivos sin información vital a la hora de tomar
decisiones en tiempos de incertidumbre.

Fuente: http://www.eumed.net/cursecon/libreria/drm/drm-estad.pdf
Tema 4: Distribuciones de probabilidad
Introducción
En esta cuarta semana identificaremos las distribuciones de probabilidad
de una variable discreta y continua, resaltando que una distribución de
probabilidad es el resultado de un experimento, la misma que es similar a
una distribución de frecuencias relativas, a diferencia que aquí estamos
refiriéndonos a la probabilidad de realizar un evento en el futuro.
Para el desarrollo de esta semana haremos énfasis en las distribuciones:
Binomial, Hipergeométrica, Poisson, Normal, T Student y Chi
Cuadrado.Según Badii & Castillo (2007). Los valores de una variable sirven
para describir o clasificar individuos o distinguir entre ellos. La mayoría de
nosotros hacemos algo más que simplemente describir, clasificar o
distinguir, porque tenemos ideas respecto a las frecuencias relativas de los
valores de una variable. En estadística decimos que la variable tiene una
función de probabilidad, una función de densidad de probabilidad o
simplemente una función de distribución.
Por lo antes mencionado debemos considerar que las distribuciones de
probabilidad se utilizan con énfasis en la toma de decisiones, es por ello
que en esta semana analizaremos y elegiremos que distribución de
probabilidad debemos utilizar
Mapa conceptual referido al tema

4.1 Distribución Binomial


Cuando el experimento tipo Bernoulli se repite 2 o más veces, y si cada
experimento o repetición son independientes unos de otros, la distribución
formada así se llama binomial. Así por ejemplo si se escogen 5 piezas de un
almacén y se prueban uno por uno y en cada prueba la pieza puede ser
declarado apto (éxito) o inapto (fracaso), el resultado de cada prueba es
independiente del anterior así como del posterior, por lo que se le puede
considerar como un fenómeno binomial, pues se repiten varias pruebas del
tipo bernoulli. (Tomeo,2003)
Definición: Se dice que una v.a. tiene una distribución binomial, si tiene
las siguientes características:
a.- Cada ensayo, prueba o repetición tiene 2 resultados: éxito y fracaso.
b.- La probabilidad del éxito es p y la del fracaso es q y permanece
constante en cada prueba o ensayo.
c.- los n ensayos son independientes.
d.- la v.a. X indica el número de éxitos en las n pruebas.
e.- cuando se realiza la selección de la muestra, se realiza uno por uno y
con reposición. La población puede ser finita o infinita.
f.- la función de cuantía es como sigue.

Ejemplo
La probabilidad de que cierto componente resista una prueba de impacto
es de 4/5. Encuentre la probabilidad de que 3 de los 5 componentes
siguientes resistan la prueba de impacto.
Solución:
Se supone que las pruebas son independientes entre si, donde p = 0,8, para
cada una de las 5 pruebas, se considera a la v.a. X como el número de
componentes que resisten la prueba.
4.2 Distribución hipergeométrica

Si la selección de la muestra se realiza uno por uno pero sin reposición de


una población finita, entonces el valor de la probabilidad de éxito va
disminuyendo de selección a selección, esta variación será más notoria si
la población es pequeña, en cambio si se tiene una población muy grande
estas probabilidades casi son similares.
Por otro lado, toda población se puede dividir en dos grupos excluyentes
de elementos llamados también de éxito o que pertenecen al éxito y otros
que corresponden al fracaso.
Se nota claramente que los ensayos o pruebas ya no son independientes,
más aún dependen de los ensayos anteriores. Las probabilidades serían
como sigue, si se tiene N elementos en la población, de los cuales A
corresponden al éxito y N-A al fracaso, si de esta población se selecciona
un elemento, la probabilidad de que pertenezca al éxito es igual a A/N, la
probabilidad de éxito del siguiente elemento escogido sería (A-1)/(N-1) y
así sucesivamente hasta completar los n elementos de la muestra, siendo
la probabilidad de éxito de este último elemento igual a (A-n+1)/(N-n+1),
pero en la práctica no necesariamente todos los elementos escogido
pertenecen al éxito, sino que habrá un combinación de éxitos y fracasos,
por lo que la variable X que indica el número de éxitos en la muestra,
tendrá una distribución del tipo hipergeométrica. (Tomeo, 2003)
Definición:
Un experimento hipergeométrico consiste en escoger una muestra al azar
de tamaño n, uno a continuación del otro y sin reposición de un conjunto
de N elementos, que tiene A elementos designados como éxitos y con N-A
elementos designados como fracasos.
Se dice que una v.a. X tiene distribución hipergeométrica, si tiene como
función de cuantía a la siguiente expresión:

4.3 Distribución de Poisson


Llamada así en honor al probabilista francés Simeón Denis Poisson. Es una
distribución de v.a. discreta en la que la variable representa al número de
éxitos en el intervalo de tiempo o espacio, estos eventos son continuos e
independientes, lo que significa que el número de éxitos que ocurren en un
intervalo de tiempo dado o espacio son independientes, de los que ocurren
en cualquier otro intervalo, pero se supone que la tasa de éxitos por
unidad de tiempo o espacio permanece constante, esta tasa lo
representaremos por l. (Espejel, 2007)

Definición:
Si X es una v.a. discreta y cuando la probabilidad de éxito es
pequeña y n es grande en un proceso binomial, donde el producto
np se hace constante, o cuando los sucesos se realizan en un
intervalo de tiempo o espacio; la distribución que representa a
este tipo de procesos aleatorios se llama Distribución de Poisson,
cuya función de cuantía está dada por la siguiente expresión:
Donde λ es el número promedio de ocurrencias por unidad de tiempo o
espacio y lt es el número promedio de ocurrencias de eventos en el
intervalo de tiempo o espacio de tamaño t.
La aproximación de una v.a del tipo binomial a una del tipo Poisson, es
muy buena si n ³ 30 y p £ 0,05
Existen muchos casos en las que se pueden usar la distribución de Poisson,
tales como: en el número de llamadas telefónicas a una central, el número
de personas que llegan a una posta médica para ser atendidos, o a la
ventanilla de un banco para hacer alguna transacción, el número de
tornillos fabricados en un día, el número de aviones que llegan a un
aeropuerto durante el día, el número de barcos que arriban a un puesto en
una semana, el número de manchitas que puede tener una loseta de 20
cm2, el número de bacterias que puede haber en un centímetro cúbico de
agua, etc., en general todos los problemas llamados líneas de espera,
teoría de colas o similares. (Espejel, 2007)

Ejemplo :
Se sabe que el número promedio de camiones que llegan a un terminal
terrestre durante el día es de 10, las instalaciones del terminal pueden
atender como máximo 15 camiones al día. ¿Cuál es la probabilidad de que
la capacidad de atención del terminal sea superado en un día cualquiera?
Solución:
X = número de camiones que llegan al terminal terrestre durante el día
para ser atendidos.
X= 0, 1, 2, 3,…..

4.4 Distribución Normal


lamada también distribución gaussiana, es la distribución de
v.a. continua más importante y seguramente la de mayor uso, es la
distribución modelo y sirve de aproximación para las demás distribuciones,
asimismo de acuerdo a la ley de los grandes números muchas estadísticas
muestrales tienen distribución normal.
Su gráfica se llama curva normal, es una curva simétrica en forma de
campana, o acampanada que se extiende sin límites en ambos sentidos
sobre la recta real o eje de las X (abscisas en el eje cartesiano).
Muchos fenómenos que ocurren en la naturaleza, en la industria y en
cualquier campo tienen distribución normal, tales como: la temperatura
del medio ambiente, la precipitación pluvial, las mediciones de
magnitudes físicas, el peso y la talla de las personas, etc. sin embargo, hay
que tener mucho cuidado para usarlo sin previa comprobación, pues las
consecuencias pueden ser impredecibles. Ejemplo si se diseña cierto
material para resistir una cantidad dada de presión que se supone se
distribuye normalmente alrededor del valor promedio y el diseño se hace
con esta suposición, el material puede verse seriamente dañado al
aplacársele una presión elevada pero dentro de los límites permisibles.Ha
sido estudiado por muchos matemáticos como La Place, De Moivre,
Gauss, etc. (Espejel, 2007)
Definición:
Se dice que una variable aleatoria continua X, tiene una distribución
normal, si su función de densidad está dada por:
4.5 Distribución T-Student
4.6 Distribución Chi Cuadrado

a distribución ji-cuadrada es la distribución muestral de S2. O sea que si se


extraen todas las muestras posibles de una población normal y a cada
muestra se le calcula su varianza, se obtendrá la distribución muestral de
varianzas.
Para estimar la varianza poblacional o la desviación estándar, se necesita
conocer el estadístico X2.

onde n es el tamaño de la muestra, s2 la varianza muestral y la


varianza de la población de donde se extrajo la muestra. (Espejel,
2007)

Propiedades de las distribuciones X- cuadrada


 Los valores de X2 son mayores o iguales que 0.
 La forma de una distribución X2 depende del gl=n-1. En consecuencia,
hay un número infinito de distribuciones X2.
 El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
 Las distribuciones X2 no son simétricas. Tienen colas estrechas que se
extienden a la derecha; esto es, están sesgadas a la derecha.
 Cuando n>2, la media de una distribución X2 es n-1 y la varianza es 2(n-
1).
 El valor modal de una distribución X2 se da en el valor (n-3).
Ejemplos:
Suponga que los tiempos requeridos por un cierto autobús para alcanzar un
de sus destinos en una ciudad grande forman una distribución normal con
una desviación estándar =1 minuto. Si se elige al azar una muestra de 17
tiempos, encuentre la probabilidad de que la varianza muestral sea mayor
que 2.
Solución:
Primero se encontrará el valor de ji-cuadrada correspondiente a s2=2 como
sigue:
Por ejemplo un encuestador podría desear saber si, el sexo, los
antecedentes étnicos o el rango salarial de una persona son factores
relevantes en la votación para una elección de algún legislador.
La definición formal de la distribución es la siguiente:
Sean Z1, Z2,…,Zk, k distribuciones normales estandar independientes.
Se denomina también la distribución Chi- cuadrado con k
grados de libertad. que puede ser cualquier entero positivo incluyendo al 1
y está representado por “df”.

Si x se distribuye mediante una x20 ,hallar :

Tema 5: Muestreo e intervalos de confianza


Introducción

Cuando realizamos una investigación como estudios de mercado, de


factibilidad, de opinión o en todo caso una investigación para obtener
algún grado académico, es necesario determinar la población donde
realizaré dichos estudios y /o investigación, donde en ocasiones no es
necesario trabajar con toda esa población, sino con parte de ella, en este
caso estaremos hablando de un muestreo, pero ¿Qué muestreo debo
aplicar?¿De cuánto debe ser la muestra?, para absolver esas preguntas e
inquietudes hemos programado para esta quinta semana temas referentes
a las técnicas de muestreo y tamaño de muestra, la misma que representa
el número de observaciones tomadas para conducir un análisis estadístico.
Además identificaremos los intervalos de confianza, la que podemos definir
como un rango de valores que depende de un coeficiente de confianza,
mediante estos intervalos de confianza encontraremos con un nivel de
confiabilidad adecuado entre que valores se encuentra cierto parámetro
estudiado, parámetros que se desarrollan en todos los campos
profesionales.

Mapa conceptual

Observa detenidamente el siguiente esquema, en el encontrarás


de un “vistazo” de manera sintetizada los principales concepto de
la temática que abordaremos. ¿Qué conceptos o categorías te
llaman la atención?
5.1 Muestreo probabilístico
Los métodos de muestreo probabilísticos son aquellos que se
basan en el principio de equiprobabilidad. Es decir, aquellos en los
que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y, consiguientemente,
todas las posibles muestras de tamaño n tienen la misma
probabilidad de ser seleccionadas. Sólo estos métodos de
muestreo probabilísticos nos aseguran la representatividad de la
muestra extraída y son, por tanto, los más recomendables.

5.1.1 Muestreo aleatorio simple


El procedimiento empleado es el siguiente:
Se asigna un número a cada individuo de la población y a través de algún
medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios,
números aleatorios generados con una calculadora u ordenador, etc.) se
eligen tantos sujetos como sea necesario para completar el tamaño de
muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad
práctica cuando la población que estamos manejando es muy grande.

5.1.2 Muestreo sistemático


Este procedimiento exige, como el anterior, numerar todos los elementos
de la población, pero en lugar de extraer n números aleatorios sólo se
extrae uno. Se parte de ese número aleatorio i, que es un número elegido
al azar, y los elementos que integran la muestra son los que ocupa los
lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k
en k, siendo k el resultado de dividir el tamaño de la población entre el
tamaño de la muestra: k= N/n. El número i que empleamos como punto de
partida será un número al azar entre 1 y k.

El riesgo este tipo de muestreo está en los casos en que se dan


periodicidades en la población ya que al elegir a los miembros de la
muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la población. Imaginemos que estamos
seleccionando una muestra sobre listas de 10 individuos en los que los 5
primeros son varones y los 5 últimos mujeres, si empleamos un muestreo
aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o
sólo mujeres, no podría haber una representación de los dos sexos.
5.1.3 Muestreo estratificado

Trata de obviar las dificultades que presentan los anteriores ya que


simplifican los procesos y suelen reducir el error muestral para un tamaño
dado de la muestra. Consiste en considerar categorías típicas diferentes
entre sí (estratos) que poseen gran homogeneidad respecto a alguna
característica (se puede estratificar, por ejemplo, según la profesión, el
municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende
con este tipo de muestreo es asegurarse de que todos los estratos de
interés estarán representados adecuadamente en la muestra. Cada estrato
funciona independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los elementos
concretos que formarán parte de la muestra.
En ocasiones las dificultades que plantean son demasiado grandes, pues
exige un conocimiento detallado de la población. (Tamaño geográfico,
sexos, edades,...).
La distribución de la muestra en función de los diferentes estratos se
denomina afijación, y puede ser de diferentes tipos:
Afijación Simple: A cada estrato le corresponde igual número de
elementos muéstrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso
(tamaño) de la población en cada estrato.
Afijación Optima: Se tiene en cuenta la previsible dispersión de los
resultados, de modo que se considera la proporción y la desviación típica.
Tiene poca aplicación ya que no se suele conocer la desviación.

5.1.4 Muestreo por conglomerados


Los métodos presentados hasta ahora están pensados para seleccionar
directamente los elementos de la población, es decir, que las unidades
muéstrales son los elementos de la población.
En el muestreo por conglomerados la unidad muestral es un grupo de
elementos de la población que forman una unidad, a la que llamamos
conglomerado. Las unidades hospitalarias, los departamentos
universitarios, una caja de determinado producto, etc., son conglomerados
naturales. En otras ocasiones se pueden utilizar conglomerados no
naturales como, por ejemplo, las urnas electorales. Cuando los
conglomerados son áreas geográficas suele hablarse de "muestreo por
áreas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un
cierto número de conglomerados (el necesario para alcanzar el tamaño
muestral establecido) y en investigar después todos los elementos
pertenecientes a los conglomerados elegidos. (Espejel, 2007)

5.2 Muestreo no probabilístico


A veces, para estudios exploratorios, el muestreo probabilístico resulta
excesivamente costoso y se acude a métodos no probabilísticos, aun siendo
conscientes de que no sirven para realizar generalizaciones (estimaciones
inferenciales sobre la población), pues no se tiene certeza de que la
muestra extraída sea representativa, ya que no todos los sujetos de la
población tienen la misma probabilidad de ser elegidos. En general se
seleccionan a los sujetos siguiendo determinados criterios procurando, en
la medida de lo posible, que la muestra sea representativa.

En algunas circunstancias los métodos estadísticos y epidemiológicos


permiten resolver los problemas de representatividad aun en situaciones
de muestreo no probabilístico, por ejemplo los estudios de caso-control,
donde los casos no son seleccionados aleatoriamente de la población.

5.2.1 Muestreo por cuotas


También denominado en ocasiones "accidental". Se asienta generalmente
sobre la base de un buen conocimiento de los estratos de la población y/o
de los individuos más "representativos" o "adecuados" para los fines de la
investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio
estratificado, pero no tiene el carácter de aleatoriedad de aquél.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un número
de individuos que reúnen unas determinadas condiciones, por ejemplo: 20
individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una
vez determinada la cuota se eligen los primeros que se encuentren que
cumplan esas características. Este método se utiliza mucho en las
encuestas de opinión.
5.2.2 Muestreo intencional o de conveniencia
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras "representativas" mediante la inclusión en la muestra de
grupos supuestamente típicos. Es muy frecuente su utilización en sondeos
preelectorales de zonas que en anteriores votaciones han marcado
tendencias de voto.

También puede ser que el investigador seleccione directa e


intencionadamente los individuos de la población. El caso más frecuente
de este procedimiento el utilizar como muestra los individuos a los que se
tiene fácil acceso (los profesores de universidad emplean con mucha
frecuencia a sus propios alumnos).
5.2.3 Muestreo Bola de Nieve
Se localiza a algunos individuos, los cuales conducen a otros, y
estos a otros, y así hasta conseguir una muestra suficiente. Este
tipo se emplea muy frecuentemente cuando se hacen estudios con
poblaciones "marginales", delincuentes, sectas, determinados tipos
de enfermos, etc.

5.2.4 Muestreo discrecional


A criterio del investigador los elementos son elegidos sobre lo que él cree
que pueden aportar al estudio.
El muestreo discrecional se utiliza en los casos en que la especialidad de
una autoridad puede seleccionar una muestra más representativa que
pueda arrojar resultados más precisos que mediante otras técnicas de
muestreo probabilístico. El proceso consiste en elegir intencionalmente a
dedo a los individuos de la población sobre la base del conocimiento o
juicio de la autoridad o investigador.

5.3 Tamaño de muestra para la media


5.4 Tamaño de muestra para la proporción

.5 Intervalo de confianza para la media


5.6 Intervalo de confianza para la proporción

Conclusiones

Luego de haber analizado y desarrollado los contenidos de la quinta


semana se llega a concluir que el muestreo es de suma importancia ya que
es una herramienta de la investigación científica, cuya función básica es
determinar que parte de una población debe examinarse, con la finalidad
de hacer inferencias sobre dicha población. Ya que es un soporte para
poder realizar inferencias a partir de la población.
Considerando además que el muestreo y los intervalos de confianza son
métodos estadísticos que optimizan el trabajo de investigación como
estudios de mercado, estudios de factibilidad, estudios de opinión, entre
otros, ya que haciendo uso de estos aplicamos la ética profesional para una
buena toma de decisiones.

Tema 6: Prueba de hipótesis y Prueba Chi


cuadrado
Introducción

Hoy en día, las pruebas de hipótesis son muy utilizadas, ya que mediante
ellas podemos tomar decisiones, decisiones que deben tener sustento
teórico, ya que una decisión errónea puede traer consigo consecuencias
fatales que pondrían en tela de juicio nuestra ética y desempeño
profesional.

Decisiones que ponen en juego nuestro desempeño profesional, es por ello


que en esta sexta semana estudiaremos, analizaremos e identificaremos,
las distintas pruebas de hipótesis, tales como la prueba de hipótesis para la
media, diferencia de medias, proporción y diferencia de proporciones; con
el fin de dar solución de manera ética a las distintas problemáticas que
tenemos en nuestro ámbito profesional.

Además conoceremos mediante que prueba estadística podemos establecer


la asociación de dos variables, asociación que en ocasiones no es muy
difícil de determinar y que es requerida en todos los campos profesionales.

Aprendizajes esperados

Conozcamos ahora las capacidades y actitudes a desarrollar en


este sexto tema:

Capacidad
o Contrasta hipótesis estadística en los casos presentados.
o Aplica la prueba estadística Chi cuadrado en la asociación de dos
variables cualitativas y la prueba estadística de Pearson o Spearman en el
caso de dos variables cuantitativas.

Actitudes
 Demuestra perseverancia en la búsqueda de soluciones.
 Participa proactivamente en el foro temático aportando ideas,
comentarios e información sobre prueba de hipótesis y asociación de
variables.

 Mapa conceptual

 Observa detenidamente el siguiente esquema, en el encontrarás de


un “vistazo” de manera sintetizada los principales concepto de la
temática que abordaremos. ¿Qué conceptos o categorías te llaman la
atención?

 Esquema 6: Mapa conceptual sobre las pruebas de hipótesis

6.1 Prueba de hipótesis para la media


6.2 Prueba de hipótesis para la diferencia de
medias
6.3 Prueba de hipótesis para la varianza

Suponga que un fabricante de pernos está produciendo pernos de 8 mm de


diámetro, y que los diámetros de estas piezas se distribuyen normalmente;
con propósitos de control de calidad, se obtuvo una muestra de 25 pernos
de una línea de producción para estimar la varianza de todos los
diámetros, la cual resultó ser S2 = 0.009 mm2. Con un nivel de significancia
de 0.05. ¿Se puede concluir que la varianza poblacional es igual o menor
0.01 mm2?
Solución:
6.4 Prueba de hipótesis para la proporción
6.5 Prueba de hipótesis para la diferencia de
proporciones

6.6 Prueba Chi cuadrado


La tabla ji- cuadrada se utiliza principalmente:
 Para probar si una serie de datos observada, concuerda con el modelo
(serie esperada) de la información.
 Para probar las diferencias entre las proporciones de varios grupos (tabla
de contingencia).

Para todos los casos, (Espejel,2007)


Ho: No hay diferencia o no hay dependencia entre variables
H1: Hay diferencia o si hay dependencia entre variables
Pasos para realizar la tabla de contingencias
1) Plantear las hipótesis:
H1: al menos dos proporciones son diferentes.

2) Construir una tabla que contenga los valores observados.


3) Sumar los totales de los renglones y columnas de los valores
observados.
4) Debajo de cada valor observado poner el valor esperado utilizando la
fórmula:
Preguntas de análisis

Estimado estudiante, hemos revisado los contenidos referentes a la


cuarta semana, y con el fin de seguir apoyándote en este proceso de
enseñanza, te sugiero que analices y des respuesta a las siguientes
preguntas:
1. ¿Qué es una hipótesis nula?
2. ¿Cuándo debo rechazar la hipótesis nula?
3. ¿En qué se diferencia la hipótesis nula de la alterna?
Al respecto para conocer un poco más sobre este tema, y dar respuesta a
las preguntas planteadas a continuación te invitamos a hacer clic en el
siguiente botón
En vez de estimar el valor de un parámetro, a veces se debe decidir si una
afirmación relativa a un parámetro es verdadera o falsa. Vale decir, probar
una hipótesis relativa a un parámetro.
Ejemplo I: Un fabricante de pintura de secado rápido afirma que el tiempo
de secado de la misma es de 20 min. El comprador diseña el siguiente
experimento: pinta 36 tableros y decide rechazar el producto si el
promedio de tiempo de secado de los mismos supera los 20.75 min. Si por
experiencia =2.4 min, se pregunta cuál es la probabilidad de rechazar la
partida aun perteneciendo a una población con media de 20 min.

Fuente:hipotesis.phttp://www.iuma.ulpgc.es/~nunez/mastertecnologiastelecomuni
cacion/Tema2InferenciaEstadistica/estadistica-y-R/2-hipotesis.pdfdf
Referencia bibliográfica

Conclusiones

Después de haber estudiado todos los contenidos de la sexta semana,


llegamos a concluir que las pruebas de hipótesis hacen uso de diferentes
procedimientos y estadísticos como Z, T y X2 .estadísticos que se adecuan a
cada problemática que se nos pueda presentar dependiendo de las
variables que manejamos en nuestro quehacer diario y que ahora
desarrollaremos de una manera ética y profesional, ya que hemos
reforzado el área investigativa que posee todo ser humano.
Ahora son capaces de diferenciar y establecer la prueba de hipótesis
adecuada para determinar la asociación de dos variables, considerando su
propio criterio para establecer un nivel de confiabilidad adecuado

Tema 7: Regresión Lineal simple y Múltiple

Introducción
Sin bien, hoy en día cuando tenemos un conjunto de datos de
cierta variable y estos datos han venido ocurriendo por un periodo
consecutivo, y necesitamos realizar una estimación o predicción
adecuada de esa variable en un periodo determinado, una de las
posibles opciones es encontrar el modelo adecuado de la variable de
acuerdo a como se ha venido manifestando. Cuando estamos ante esa
problemática debemos enfocarnos ante un modelo de regresión, existen
diversos modelos, pero en esta semana sólo estudiaremos la regresión
lineal simple y una introducción a la regresión lineal múltiple, la misma
que está referidas a los modelos que tienen más de una variable
independiente.

Po lo antes mencionado, en esta última semana conoceremos y


analizaremos los modelos de Regresión lineal simple y múltiple, los mismos
que se usan en muchos procesos en los que se tengan que tomar decisiones
o hacer inferencias acerca de algún fenómeno donde aún no conozcamos su
resultado, en el que se tenga información de una variable independiente y
el comportamiento de otra variable que depende de la primera.
Conozcamos ahora las capacidades y actitudes a desarrollar en este
séptimo tema:

Capacidad
 Elabora modelos de regresión a través del método de mínimos cuadrados.
 Establece relaciones entre dos o más variables cuantitativas, tomando
como referencia diagramas de dispersión o nube de puntos.
 Estima e interpreta los coeficientes de regresión, de correlación y de
determinación entre variables cuantitativas.

Actitudes
 Demuestra perseverancia en la búsqueda de soluciones.
 Participa proactivamente en el foro temático aportando ideas,
comentarios e información sobre Regresión lineal simple y múltiple.
Mapa conceptual

7.1 Introducción a la Regresión Lineal simple


El objeto de un análisis de regresión es investigar la relación
estadística que existe entre una variable dependiente (Y) y una o
más variables independientes (X1,X2 ... ). Para poder realizar esta
investigación, se debe postular una relación funcional entre las
variables. Debido a su simplicidad analítica, la forma funcional que
más se utiliza en la práctica es la relación lineal. Cuando solo
existe una variable independiente, esto se reduce a una línea
recta:

donde los coeficientes b0 y b1 son parámetros que definen la posición e


inclinación de la recta. (Nótese que hemos usado el símbolo especial para
representar el valor de Y calculado por la recta. Como veremos, el valor
real de Y rara vez coincide exactamente con el valor calculado, por lo que
es importante hacer esta distinción.)

El parámetro b0, conocido como la “ordenada en el origen,” nos indica


cuánto es Y cuando X = 0. El parámetro b1, conocido como la
“pendiente,” nos indica cuánto aumenta Y por cada aumento de una
unidad en X. Nuestro problema consiste en obtener estimaciones de estos
coeficientes a partir de una muestra de observaciones sobre las variables Y
y X. En el análisis de regresión, estas estimaciones se obtienen por medio
del método de mínimos cuadrados. (Espejel,2007)
7.1.1 Método de mínimos cuadrados
Para estimar los coeficientes por medio de mínimos cuadrados, se utilizan
las siguientes fórmulas:
7.1.2. Coeficiente de correlación

7.1.3 Coeficiente de determinación

Una pregunta importante que se plantea en el análisis de regresión


es la siguiente: ¿Qué porcentaje de la variación total en Y se debe
a la variación en X? En otras palabras, ¿cuál es la proporción de la
variación total en Y que puede ser “explicada” por la variación en
X? El estadístico que mide esta proporción o porcentaje se
denomina coeficiente de determinación:

7.2 Introducción a la Regresión lineal múltiple


Hasta ahora hemos considerado únicamente el caso de la regresión
simple. En el caso más general de la regresión múltiple, existen
dos o más variables independientes:

La estimación de los coeficientes de una regresión múltiple es un


cálculo bastante complicado y laborioso, por lo que se requiere del
empleo de programas de computación especializados. Sin
embargo, la interpretación de los coeficientes es similar al caso de
la regresión simple: el coeficiente de cada variable independiente
mide el efecto separado que esta variable tiene sobre la variable
dependiente. El coeficiente de determinación, por otro lado, mide
el porcentaje de la variación total en Y que es explicado por la
variación conjunta de las variables independientes. (Tomeo, 2003)

Preguntas de análisis

Estimado estudiante, hemos revisado los contenidos referentes a la


séptima semana, y con el fin de seguir apoyándote en este proceso de
enseñanza, te sugiero que analices y des respuesta a las siguientes
preguntas:

1. ¿Cuál es la diferencia entre una regresión lineal y una múltiple?


2. ¿En qué momento haces uso de una regresión?
3. ¿Se puede considerar una regresión lineal aquel modelo que considera
dos variables X?

Al respecto para conocer un poco más sobre este tema, y dar respuesta a
las preguntas planteadas a continuación te invitamos a hacer clic en el
siguiente botón
El análisis de regresión consiste en emplear métodos que permitan
determinar la mejor relación funcional entre dos o más variables
concomitantes (o relacionadas). El análisis de correlación estudia el grado
de asociación de dos o más variables.
Análisis de Regresión
Una relación funcional matemáticamente hablando, está dada por:
Y = f(x1,...,xn; θ1,...,θm)
Donde:
Y : Variable respuesta (o dependiente)
xi : La i-ésima variable independiente (i=1,..,n)
θj : El j-ésimo parámetro en la función (j=1,..,m)
f : La función

Para elegir una relación funcional particular como la representativa de la


población bajo investigación, usualmente se procede:
1) Una consideración analítica del fenómeno que nos ocupa, y
2) Un examen de diagramas de dispersión.

Fuente: http://tarwi.lamolina.edu.pe/~fmendiburu/index-
filer/academic/metodos1/Regresion.pdf

Conclusiones

Después de haber estudiado todos los contenidos de la Séptima semana


concluimos, que la regresión lineal simple o múltiple son adecuados para
encontrar modelos predictivos, considerando que para encontrar esos
modelos debemos analizar la tendencia que tiene o tienen las variables X
en un tiempo determinado con la variable dependiente Y.
Además en esta última semana hemos analizado y determinado cuan
confiable puede ser el modelo encontrado haciendo uso del coeficiente de
determinación R2.
En conclusión en esta última semana hemos logrado generar modelos
predictivos que pulen nuestra labor y ética profesional, considerando que
estos modelos pueden ser utilizados en todos los campos profesionales
como el rubro educativo, ingeniería, salud, entre otros

Potrebbero piacerti anche