Sei sulla pagina 1di 35

MÉTODOS

CUANTITATIVOS I
MAT-335
Prof. Maxie Salazar Gross
Unidad I
Introducción a la Estadística
• Introducción
• Importancia de la Estadística
• Historia de la Estadística
• Aplicaciones de la Estadística
• Los Datos
• Características
• Escalas de Medición
• Clasificaciones
• Fuentes
• Errores en la adquisición de los datos
• Ramas de la Estadística
• Ética en la Práctica Estadística
Introducción
Introducción
Es frecuente ver en las noticias y escuchar en entrevistas frases como las siguientes:
• El tiempo medio que tarda una persona en llegar a su trabajo es de 25.3 minutos.
• 11% de las viviendas en los Estados Unidos están vacías.
Los datos numéricos utilizados en las frases anteriores son conocidos como estadísticas. En
este sentido, el término estadística se refiere a datos numéricos como promedios, medias,
porcentajes, que nos ayudan a entender una variedad de situaciones.
Sin embargo, como veremos más adelante, el campo o materia de la estadística abarca
mucho más que los datos numéricos.
En un sentido más amplio, la estadística se define como el arte y la ciencia de recolectar,
analizar e interpretar datos.
En particular en los negocios y la economía, la información que se obtiene a partir de la
recolección, el análisis, la presentación y la interpretación de los datos permite a los
administradores o gerentes y a quienes toman decisiones comprender mejor el entorno
económico y de los negocios, y por tanto asumir mejores y más informadas decisiones.
Importancia de la Estadística
La estadística es de gran importancia en la investigación científica debido a que:
• Permite una descripción más exacta.
• Nos obliga a ser claros y exactos en nuestros procedimientos y en nuestro pensar.
• Permite resumir los resultados de manera significativa y cómoda.
• Nos permite deducir conclusiones generales.
Historia
El vocablo statistik proviene de la palabra italiana statista (que significa “estadista”), y es
tan vieja como la historia registrada.
El Viejo Testamento contiene varios informes sobre levantamiento de censos. Los
gobiernos de los antiguos Babilonia, Egipto y Roma reunieron registros detallados sobre
población y recursos.
Por el año 1806, Guillermo el Conquistador ordenó que se escribiera el Domesday Book, un
registro de la propiedad, extensión y valor de las tierras de Inglaterra. Este trabajo fue el
primer resumen estadístico de Inglaterra. Durante un brote de peste, a finales del siglo XVI,
el gobierno inglés empezó a publicar semanalmente las estadísticas de mortalidad.
En 1662, el capitán John Graunt utilizó 30 años de dichos listados para hacer predicciones
sobre el número de personas que morirían a causa de diferentes enfermedades, y sobre la
proporción de nacimientos, de ambos sexos, que podía esperarse. El estudio de Graunt fue
uno de los primeros análisis estadísticos.
La historia del desarrollo de la teoría estadística y su práctica es larga; sólo hemos listado
algunas de las personas que hicieron contribuciones significativas al campo. Más adelante
encontraremos a otras cuyos nombres están relacionados con leyes y métodos específicos.
Aplicaciones de la Estadística
• Contabilidad
Las firmas contables públicas utilizan procedimientos de muestreo estadístico cuando realizan
auditorías para sus clientes.
• Marketing
Los fabricantes de productos compran datos y resúmenes estadísticos sobre actividades
promocionales, como la fijación de precios especiales y el uso de exhibidores dentro de las
tiendas, asimismo, los gerentes de marca pueden revisar las estadísticas de los escáneres y de la
actividad promocional para comprender mejor la relación entre las actividades de promoción y
las ventas. Estos análisis a menudo son útiles para establecer estrategias de marketing futuras
para diversos productos.
• Producción
El énfasis actual en la calidad hace que su control sea una aplicación importante de la estadística
en la producción. Una variedad de gráficas estadísticas de control de calidad se usan para
monitorear el resultado de un proceso de producción.
• Economía
Los economistas a menudo proporcionan pronósticos acerca del futuro de la economía o sobre
algún otro aspecto relacionado. Utilizan una variedad de información estadística para
elaborarlos.
Los Datos
Los Datos
Los datos son los hechos y las cifras recolectados, analizados y resumidos para su
interpretación. Todos los datos recolectados en un estudio en particular se conocen como
banco de datos o base de datos, mientras que una sola cifra u observación es un dato
puntual.

Características
Los elementos son las entidades a partir de las cuales se reúnen los datos.
Las variables son las características de interés para los elementos.
Al conjunto de mediciones obtenidas para un elemento en particular se llama observación.
Ejemplo
5 Elementos 2 Variables

Estudiante Edad Carrera


Laura 21 Psicología
Luis 20 Contabilidad
5 Observaciones Gabriel 22 Ingeniería Industrial
Diana 20 Arquitectura
Pedro 21 Economía

Dato Puntual Base de Datos


Ejercicio
Tipo
Valor Razón de Calificación
Fondo de Inversión de
Neto Gasto Morning Star
Fondo
Artisan Small Cap DE 16.92 1.18 3 estrellas
Brown Cap Small DE 35.73 1.20 4 estrellas
Fidelity Overseas IE 48.39 0.90 4 estrellas
Oakmark I DE 40.37 1.05 2 estrellas
RS Value A DE 26.27 1.36 4 estrellas
USAA Income FI 12.10 0.62 3 estrellas
Vanguard Sm Cp Idx DE 32.58 0.23 3 estrellas

Elementos = 7 Fondos de Inversión


Variables = 4 Variables: Tipo de Fondo, Valor Neto, Razón de Gasto y Calificación
Escalas de Medición
La recolección de datos requiere tener una escala de medición. Dichas escalas determinan
la cantidad de información contenida en los datos e indican la manera apropiada de
resumirlos y analizarlos estadísticamente.

Los tipos de escala de medición son:


• Escala Nominal
• Escala Ordinal
• Escala de Intérvalo
• Escala de Razón o Ratio
Escala Nominal
Cuando los datos de una variable se componen de etiquetas o nombres utilizados para
identificar algún atributo de los elementos, la escala de medición se considera nominal.
Los datos nominales pueden ser numéricos o no numéricos.
Por ejemplo, si la unidad de análisis es un grupo de personas, para clasificarlas se puede
establecer la categoría sexo con dos niveles, masculino (M) y femenino (F). Igual el número
de cédula de una persona es un dato nominal numérico.
Escala Ordinal
La escala de medición de una variable es ordinal si los datos exhiben las propiedades de los
datos nominales y su orden o clasificación es significativo. Igualmente pueden ser
numéricos o no numéricos.
Por ejemplo, las calificaciones universitarias en PUCMM son A, B, C, D y F. Dado que las
calificaciones dependen de un rango numérico en el que el rango de calificación de la A es
mayor que el rango de la B, y así sucesivamente, esta variable se dice se encuentra en
escala ordinal.
Escala de Intervalo
En una escala de intervalo para una variable los datos presentan todas las propiedades de
los datos ordinales, y el intervalo entre los valores se expresa en términos de una unidad
de medida fija. Los datos de intervalo son SIEMPRE numéricos.
Un ejemplo de la escala de intervalo es la calificación universitaria mencionada
anteriormente, pero utilizando la conversion de las letras a sus respectivos intervalos
numéricos.

Calificación Intervalo Límite Inferior (Li) Límite Superior (Ls)


A 90-100 90 100
B 80-89 80 89
C 70-79 70 79
D 60-69 60 69
F 0-59 0 59
Escala de Razón
En una escala de razón los datos tienen todas las propiedades de los datos de intervalo y la
razón de los dos valores es significativa. Esta escala require que se los datos sean
numéricos y que incluyan un valor cero para indicar que en este punto no existe un valor
para la variable.
Para la medición de variables como la distancia, la estatura, el peso y el tiempo se usa la
escala de razón.
Ejercicio
Diga, en cada caso, el tipo de escala de medición que debería ser utilizado en cada caso:

1. Temperatura en grados Celsius de la ciudad de Sto. Dgo.


Intervalo
2. Color de cabello de los estudiantes de esta aula.
Nominal
3. Nivel de satisfacción de los clientes de un negocio.
Ordinal
4. El tiempo que le toma a cada estudiante en realizar el ejercicio.
Razón
Clasificaciones
Los datos se pueden clasificar dependiendo de dos propiedades:

o Contenido
• Categóricos
• Cuantitativos
• Discretos
• Continuos
o Horizonte Temporal
• Corte Transversal
• Series de Tiempo
• Longitudinales o de Panel
Clasificación por su Contenido
Datos Categóricos
Incluyen aquellos datos que se agrupan en categorías específicas. Las variables que
incluyen datos categóricos se llaman variables categóricas.
Este tipo de datos utiliza una escala de medición que puede ser nominal u ordinal. Un
ejemplo de datos categóricos es el género de los estudiantes de este salón.
Si la variable es categórica, el análisis estadístico es muy limitado. Los datos categóricos se
resumen mediante el conteo del número de observaciones en cada categoría o por medio
del cálculo de la proporción de las observaciones en cada categoría.
Sin embargo, aun cuando estos datos se identifican por medio de un código aritmético,
operaciones como la suma, la resta, la multiplicación y la división no producen resultados
que tengan sentido.
Datos Cuantitativos
Son aquellos que utilizan valores numéricos para indicar cuántas cantidades se conocen de
un determinado elemento.
Las variables que incluyen datos cuatitativos se llaman variables cuantitativas. Este tipo de
datos utiliza una escala de medición que puede ser de intervalo o de razón.
Si la variable es cuantitativa, el análisis estadístico es mucho más permisivo, las
operaciones aritméticas sí proporcionan resultados con sentido.
Por ejemplo, los datos cuantitativos pueden sumarse y luego dividirse entre el número de
observaciones para calcular el valor promedio, el cual tiene significado y se interpreta con
facilidad.
En general, se tienen más alternativas para el análisis estadístico cuando los datos son
cuantitativos.
Los datos cuantitativos, a su vez, se clasifican en dos grandes grupos:

• Datos Cuantitativos Discretos: Son aquellos que toman valores aislados. Es decir, no es
posible tener una fracción de una unidad. Ejemplo: La cantidad de hijos que tiene una
madre.

• Datos Cuantitativos Continuos: Son aquellos que, entre dos valores cualesquiera,
permite que hayan valores fraccionarios. Ejemplo: La cantidad de minutos
transcurridos en la clase de hoy.

Es importante recordar que, aunque muchos datos se agrupen de manera discreta,


realmente son continuos, como por ejemplo la edad.
Ejercicio
Para cada caso, indique el tipo de datos que se utiliza:

1. Balance de la tarjeta de crédito de una persona.


Cuantitativo Continuo
2. Género de los estudiantes de esta aula.
Categórico
3. Número de regalos recibidos en Navidad.
Cuantitativo Discreto
4. Peso de los estudiantes de esta aula.
Cuantitativo Continuo
Clasificación por su Horizonte Temporal
Datos de Corte Transversal
Estos datos son recolectados en el mismo momento, o aproximadamente al mismo tiempo.
Corresponden a información de los elementos en un período de tiempo determinado.
Un ejemplo de datos de corte transversal sería nuestro ejemplo de la base de datos de los
estudiantes, ya que toda esa información corresponde las características de dichos
estudiantes en ese momento.

Datos de Series de Tiempo


Estos son recolectados a lo largo de varios períodos. Es decir, corresponde a información de
un elemento a lo largo de multiples períodos.
Un ejemplo de esto sería la estatura de un niño en sus primeros 5 años.
Datos de Panel o Longitudinales
Son aquellos datos que tienen las mismas propiedades de los datos de corte transversal y
de datos de series de tiempo. Es decir, contienen información de múltiples elementos en
multiples momentos en el tiempo. Un ejemplo sería el siguiente:

Estatura Niño 1 Estatura Niño 2


Edad (en años)
(en pulg.) (en pulg.)
0 19.69 21.26
1 29.92 27.95
2 34.65 35.83
Ejercicio
Diga el tipo de datos por horizonte temporal en cada caso:

1. Cantidad de Habitantes de la República Dominicana por Provincia en los últimos 3


años.
Longitudinales o de Panel
2. Calificación promedio de los estudiantes dominicanos por universidad en el año 2000.
Corte Transversal
3. Balance promedio de Cuenta Corriente de un cliente en los últimos 10 años.
Serie de Tiempo
Fuentes de los Datos
Las fuentes de los datos se clasifican de acuerdo a su origen en:

• Fuentes existentes
• Estudios diseñados para recolectar datos nuevos.
• Estudios experimentales
• Estudios observacionales o no experimentales
Fuentes Existentes
En algunos casos, los datos necesarios para una aplicación o análisis en particular ya
existen en una o múltiples bases de datos.
En este caso no existe manera de modificar la data para satisfacer cualquier necesidad que
tenga el análisis que se desee realizar, por lo que este tipo de datos tiene finitas maneras
de ser analizados.
Las empresas mantienen una variedad de bases de datos sobre sus empleados, clientes y
operaciones de negocios. Otros registros internos contienen datos sobre ventas, gastos de
publicidad, costos de distribución, niveles de inventario y cantidades de producción.
Las empresas tienen acceso a estas fuentes de datos externos por medio de acuerdos o al
comprarlos. También se obtienen datos de diversas asociaciones de la industria y de
organizaciones de interés especial, igual como de Internet y agencias gubernamentales.
Estudios para Recolección Nuevos Datos
En numerosas ocasiones los datos no están disponibles a través de fuentes existentes. En
estos casos, los datos suelen obtenerse a través de estudios estadísticos.
Los estudios estadísticos se clasifican en:
• Estudios experimentales
• Estudios observacionales o no experimentales

Estudios Experimentales
En estos estudios se debe identificar la variable de interés y luego se toman una o más
variables para ser controladas y ver cómo influyen estas variables sobre la de interés.
Un ejemplo sería un estudio de una farmacéutica para conocer cómo afecta un Nuevo
medicamento la presión sanguínea, que sería la variable de interés.
Como variable de control se selecciona la dosis del medicamento que será suministrado a
distintos pacientes y se verifica la presión sanguínea de los pacientes antes y después de la
ingesta del medicamento.
Estudios Observacionales
Los estudios no experimentales u observacionales no intentan controlar las variables de
interés de ninguna manera. Se basan en la obtención de datos para ser analizados tal y
como son.
Los estudios experimentales más conocidos son:
• Las Encuestas: es un cuestionario que incluye todas las preguntas necesarias para
resolver un determinado problema o realizar un determinado análisis.
• Los Censos: es el proceso de realizar una encuesta para recolectar datos de toda una
población.
Cualquiera que desee usar datos y realizar análisis estadísticos como apoyo en la toma de
decisiones debe considerar el tiempo y el costo requeridos para obtenerlos.
La regla general en estos casos es que el costo de la adquisición de los datos y el análisis
estadístico subsiguiente no deben exceder los ahorros generados por el uso de la
información para tomar una mejor decisión.
Errores en la Adquisición de los Datos
Siempre existe la posibilidad de errores en los estudios estadísticos. El uso de datos
erróneos es peor a no usar datos en lo absoluto. Una equivocación en la adquisición de los
datos ocurre siempre que el valor de los datos obtenidos no es igual al valor verdadero o
real que se obtendría con un procedimiento correcto.
Por ejemplo, un entrevistador podría cometer una falla de registro, como una transposición
de los números cuando escribe la edad de una persona, es decir, que anote 42 en vez de 24
años.
Previo al análisis siempre es importante revisar los datos para intentar encontrar
informaciones que no hacen sentido y/o valores inusualmente grandes o pequeños. Por
ejemplo, el analista debe revisar la precisión de los datos para una persona entrevistada
que indica que tiene 22 años de edad pero reporta 20 años de experiencia laboral
A estos datos con valores inusualmente grandes o pequeños se les llama atípicos y se debe
tener mucho cuidado al momento de realizar un análisis en donde estén presentes este
tipo de valores ya que pueden alterar significativamente los resultados.
Ramas de la Estadística
Estadística Descriptiva
Es aquella que se encarga de recolectar, procesar resumir y presentar, de manera que
facilite la comprensión al lector, datos reales. Los resultados siempre son conocidos y nos
dice exactamente lo que estamos viendo.
La mayor parte de la información estadística en periódicos, revistas, informes de empresas
y otras publicaciones consiste en datos que se resumen y presentan en una forma fácil de
comprender para el lector, que son parte de la estadística descriptiva.
De acuerdo a la cantidad de elementos estudiados, el conjunto de dichos elementos se
clasifican en:
• Población: es el conjunto de todos los elementos de interés en un estudio en particular.
• Muestra: es un subconjunto de la población.
Es casi imposible conocer la población completa de un determinado estudio, por esta
razón, casi siempre lo que se tiene es una muestra de la población.
Estadística Inferencial
Es aquella que se encarga de sacar conclusiones tomando en cuenta como base, los
resultados obtenidos en la estadística descriptiva de una determinada muestra, para hacer
estimaciones y probar hipótesis sobre las características de una población.
Por ejemplo, se podría estimar el índice acumulado de todos los estudiantes de esta
universidad basándonos en la información de los índices acumulados de los estudiantes de
esta aula.
Ética en la Práctica Estadística
Ética en la Práctica Estadística
El comportamiento ético es algo por lo que debemos luchar en todo lo que realizamos. Los
problemas éticos surgen en la estadística debido a la importancia que ésta tiene en la
recolección, el análisis, la presentación y la interpretación de los datos.
En un estudio estadístico, el comportamiento poco ético puede adoptar una variedad de
formas que incluyen el muestreo impropio, el análisis inapropiado de los datos, el
desarrollo de gráficas erróneas, el uso de resúmenes estadísticos inadecuados o una
interpretación tendenciosa de los resultados estadísticos.
Varias pautas éticas en las responsabilidades y publicaciones se relacionan con problemas
que involucran el manejo de datos y evitar cualquier tendencia a sesgar su trabajo hacia
resultados predeterminados.
Referencias

• Anderson, Sweeney y Williams. Estadística para Negocios y Economía. 11va Edición.


Cengage Learning, 2012.

• Levin, Rubin, Bohon y Ramos. Estadística para Administración y Economía. 7ma Edición.
Pearson Learning, 2010.

Potrebbero piacerti anche