Sei sulla pagina 1di 6

TRATAMIENTO ESTADISTICO DE DATOS El anlisis estadstico posibilita la obtencin de medidas de centralizacin, dispersin y tendencias temporales en las series de observaciones

de los fenmenos meteorolgicos con el fin de analizar la zonacin de estos fenmenos. A continuacin abordamos muy brevemente algunos de los parmetros estadsticos ms usuales en Climatologa. Media: es el cociente entre la suma de todos los valores de la serie y el nmero de datos de la serie. Mediana: es el valor que divide a una serie ordenada en dos conjuntos de igual probabilidad. La mediana se corresponde con el percentil 50. Varianza y la desviacin tpica: son parmetros de uso comn. La varianza es la media aritmtica de los cuadrados de las diferencias de cada valor con respecto a la media.

El diseo estadstico de la investigacin

El tratamiento estadstico debe partir con la frecuencia simple (nmero de frecuencia de los datos e informacin y porcentaje)del dato e informacin de cada una de las variables. El dato e informacin debe tabularse considerando la "matriz de base de dato" (m.b.d)expresandose en valor absoluto de las variables para luego determinar el nmero de la frecuencia y poder elaborar los cuadros o tablas que se deseen de acuerdo al tratamiento que se quiera dar.

Las medidas estadsticas

El diseo estadstico y las relaciones entre los datos cuantitativos y cualitativos

Estadstica descriptiva:
Distribucin de frecuencia. Medidas de tendencia central. Medidas de variabilidad.

Medidas estadsticas:

Medidas de tendencia central:


o o o o media aritmtica. media geomtrica. Mediana. Moda.

Medidas de dispersin:
o o o Varianza. Desviacin estndar. Coeficiente de variacin.

Medidas de forma:
o o Coeficiente de asimetra. Coeficiente de apuntamiento.

La Correlacin:

Significado y alcance Interpretacin Relacin entre correlacin y causalidad

Anlisis Multivariado.
Regresin: Regresin Mltiple. Anlisis lineal de patrones. Anlisis de factores. Anlisis de varianza

Tratamiento estadstico En el trabajo de campo con la aplicacin de distintos instrumentos de recogida de datos, se obtienen obviamente los datos que necesitamos, y que nos propusimos en el proyecto, los que nos permitirn arribar a conclusiones cientficamente fundamentadas, pero, esos datos as obtenidos en bruto no nos aportan muchos elementos, es necesario lograr que nos ayuden a llegar a las esencias, a los nexos genticos, a las causas, y para ello necesitamos procesarlos, es decir, organizarlos, tabularlos, presentarlos y analizarlos, de manera que faciliten nuestra labor investigativa. La ciencia que se dedica a este trabajo con los datos es la Estadstica. En la presente obra no pretendemos dar un tratamiento profundo a esta temtica, pues existen infinidad de textos que lo abordan, sino plantear algunos elementos que se emplean ms comnmente por los investigadores de las ciencias pedaggicas. Existe la Estadstica Descriptiva y la Inferencial. La primera se dedica a describir y analizar grupos de datos en una muestra, sin llegar a conclusiones ni hacer inferencias a toda la poblacin, la Inferencial por su parte arriba a conclusiones de toda la poblacin, infiere, predice, decide Para iniciar el estudio del tratamiento estadstico a los datos de la investigacin es necesario retomar los conceptos de variables estudiados a partir de la pgina 67 dela presente obra, donde se expone la existencia de variables cualitativas y cuantitativas. Las primeras no se miden numricamente y las segundas s. Centrmonos en las cuantitativas. Somos del criterio que existen algunas variables muy bien definidas, por ejemplo, el nmero de alumnos de un grupo es cuantitativa, y el sexo es cualitativa, sin embargo existen otras donde no se manifiesta una barrera entre lo cualitativo y lo cuantitativo, por ejemplo, las calificaciones de un estudiante, pudieran ser Excelente, Bien, Aprobado y Desaprobado, sera una variable cualitativa, sin embargo, si las notas se consideraran 5, 4, 3 y 2, existe una correspondencia en el trabajo didctico, pero una cae en el campo cuantitativo y la otra en el cualitativo; lo que no es lo mismo que cuando por ejemplo, al sexo masculino le damos valor 1 y al femenino 2(codificamos), eso no significa que esta variable haya tomado esos valores y sea susceptible

de anlisis cuantitativos, ello es una codificacin, que se emplea por ejemplo para el trabajo con los software estadsticos. Ahora bien, existen entre otras, tres operaciones bsicas que se utilizan en el procesamiento estadstico, que son la codificacin, la tabulacin y la graficacin. La codificacin, como ha quedado evidenciado en el prrafo anterior, es cuandodamos valores cuantitativos a los atributos cualitativos de determinada variable, parafacilitar el trabajo estadstico, lo que no significa precisamente que se convierta enuna variable cuantitativa. Ejemplo, variable nacionalidad: cubana, cdigo 1; colombiana, cdigo 2; brasilera, cdigo 3; mexicana, cdigo 4; peruana, cdigo 5; y as sucesivamente hasta codificar a todos los alumnos de diferentes nacionalidades con que se est trabajando la investigacin. La tabulacin es el ordenamiento de los datos en tablas o cuadros estadsticos que disea el investigador, lo cual facilita los clculos y los anlisis, y sirven de base para hacer los grficos y para las pruebas estadsticas. La graficacin por ltimo, es un proceso muy importante en la investigacin pedaggica, pues permite a golpe de vista realizar anlisis que en las tablas se hacen mucho ms difciles, por ejemplo, tendencias del desarrollo de un proceso o fenmeno objeto de estudio, comportamiento histrico, comportamientos mximos y mnimos, etctera. 3.2.3.1 Escalas de clasificacin de variables Aunque las escalas se estudiaron en las pginas 83 y siguientes como importantes medios auxiliares del investigador para tratar de objetivar lo ms posible las observaciones, seguidamente las abordaremos como instrumentos de trabajo estadstico en las investigaciones. Una escala de clasificacin es el conjunto de clases o de categoras que corresponden al comportamiento de la variable en cuestin. En las cualitativas, en algunos casos la propia naturaleza la impone, por ejemplo, variable sexo, solo tiene dos clases o categoras, masculino y femenino , pero la variable aprovechamiento acadmico del estudiante puede asumir diferentes categoras, que decidir el investigador de acuerdo con sus objetivos y las caractersticas de la investigacin que desarrolla, por ejemplo, pudiera ser bien, regular y mal, pero tambin pudiera definirse con excelente, muy bien, bien, regular y mal. Con las variables cuantitativas se procede de la siguiente manera: por ejemplo, variable calificaciones en una asignatura. 3.2.3.2 Tablas y grficos Las tablas las consideramos recursos estadsticos para representar datos, que en mayor o menor medida empleamos todos los investigadores, por lo tiles que resultan para el trabajo, como se ha planteado anteriormente. Se disean por los propios investigadores de acuerdo con las necesidades y objetivos de la investigacin. Una tabla consta de ttulo, cuerpo de la tabla, fuente y notas aclaratorias. Generalmente a las tablas se les antepone una identificacin para ubicarlas en el informe de investigacin, en una tesis, en un texto, en un artculo para una revista, en fin, en cualquier documento, se identifican por un nmero, una letra u otra seal, y seguidamente se plantea el ttulo el que debe ser concreto pero que exprese la esencia de lo que se presenta, y en general responde a las preguntas qu, cundo, cmo y dnde. En ocasiones no responde a las cuatro preguntas, pues en el contexto del documento se han planteado algunos de estos elementos y no se precisa repetir. Por ejemplo: Tabla 1. Relacin de notas de Metodologa de la Investigacin de los alumnos del grupo de Maestra en Educacin del IPLAC en el curso escolar 2004-05.El cuerpo de la tabla es el cuadro conformado por filas (horizontales) y columnas (verticales) Las tablas deben tener la propiedad de explicar fcilmente lo que se pretende por lo que no se deben cargar con mucha informacin. Pueden ser unidimensionales, bidimensionales y multidimensionales. Las ms empleadas son las dos primeras, y en general tienen una primera columna (de la izquierda) que algunos autores llaman columna matriz, donde se sitan elementos bsicos de lo que pretendemos representar, por ejemplo, nombre de personas o de objetos, o los intervalos de frecuencia como se observa en la tabla anterior, y despus el nmero de columnas necesarias de acuerdo con nuestras necesidades. La primera fila se toma como encabezamiento y la ltima puede tomarse para los totales si es necesario. En la prctica de la investigacin se emplean frecuentemente para facilitar los clculos cuando tenemos que aplicar una frmula, por ejemplo, para calcular la varianza S(2), que su frmula es: 3.2.3.3 Elementos de estadstica descriptiva Antes de iniciar el estudio de estos elementos es necesario conocer el concepto de estadgrafo. Para nosotros estadgrafo es el parmetro que describe una caracterstica de una muestra o poblacin. Existen los de posicin, los de dispersin y los de deformacin o apuntamiento De

posicin son los llamados de tendencia central ya que sus valores tienden al centro de la serie o distribucin; entre ellos estn la media aritmtica, la mediana y la moda. De dispersin son los que permiten determinar el grado de agrupamiento entre los datos de la serie o distribucin; entre ellos estn el rango, la varianza y la desviacin tpica o standart. De deformacin o apuntamiento son los que permiten conocer la forma que presentan las distribuciones de frecuencias, tanto de los lados respecto al centro(deformacin) como en cuanto a su altura (apuntamiento). (Fiallo y Cerezal, 2003) Estadgrafos de tendencia central La media aritmtica es un estadgrafo de tendencia central, que est ubicado en el centro de la serie de observaciones, es el conocido valor promedio. La Mediana es tambin un importante estadgrafo, y es el valor central de las observaciones una vez ordenadas stas ascendente o descendentemente. Si el nmero de datos es impar, se cuenta y se busca el central, si el nmero es par, se localizan los dos del centro y se le halla la media por el procedimiento ya conocido. En el ejemplo que venimos desarrollando se procede de la siguiente manera: 51, 54, 60, 63, 70, 75, 77, 81, 87, 87, 88, 91, 93, 97, 100 Una vez ordenados, como son 15 datos, el del centro es el nmero 8, es decir, el 81, pues a ste le quedan 7 datos a la derecha y 7 a la izquierda. Veamos otro ejemplo: ocho estudiantes de una escuela tienen las siguientes tallas (en centmetros):146, 149, 150, 152, 155, 158, 159, 163Los valores centrales son 152 y 155. Su media ser: (152+155)/2 =153.5 La mediana ser 153.5. La Moda es el estadgrafo que ms se repite en una serie de observaciones, y se obtiene por simple inspeccin, no necesita aplicar frmulas ni clculo alguno. En los dos ejemplos anteriores, en el de las notas la moda es el 87 que es el nico que se repite, y en el de las tallas, sencillamente no hay moda porque ninguno se repite. Puede darse el caso de que varios datos se repitan igual nmero de veces, entonces tendremos varias modas. Este no es un estadgrafo confiable por lo que no es de mucha utilidad para los diferentes clculos estadsticos. Los estadgrafos de posicin que acabamos de estudiar (media, mediana y moda),es decir las medidas de tendencia central, aunque sirven para caracterizar una serie de datos, se limitan a poner de manifiesto un valor conjunto de todos los valores dela serie, pero no la describen de un modo perfecto, ya que no dan informacin acerca de cmo se distribuyen los elementos alrededor del valor central. Tampoco proporcionan informacin acerca de si los elementos pequeos son ms numerosos que los grandes, ni se dan las diferencias o desviaciones entre ellos, si varan o no de manera regular y si son grandes o pequeas. (Fiallo y Cerezal, 2003)Para erradicar las limitaciones expuestas empleamos los estadgrafos de dispersin o medidas de dispersin. Estadgrafos de dispersin Estas son medidas que nos expresan la forma en que estn dispersos o diseminados los valores (observaciones) alrededor del valor central o medida de tendencia central (generalmente media o mediana). Los ms utilizados son el rango, la desviacin media, la varianza, la desviacin standard o tpica y el coeficiente devariacin. El Rango es el mayor intervalo de una serie, es decir la diferencia entre el lmite superior y el inferior. Muy sencillo de calcular, y nos resulta de utilidad a la hora de definir la cantidad de intervalos en una serie. En el ejemplo de las calificaciones de los quince alumnos que venimos empleando el rango ser: 63+75+100+54+87+93+91+87+97+81+77+88+70+51+60 El lmite inferior es 51 y el superior 100, por lo tanto el rango es 100-51= 49. Si bien es til, no nos permite inferir sobre la dispersin de los valores observados en relacin con el valor central La desviacin media es el promedio (media aritmtica) de todas las desviaciones. Una desviacin es la resta del valor observado (Xi) menos el valor promedio (X) La varianza y la desviacin standart o tpica. La primera es un estadgrafo importante de la desviacin, que se representa por S2, pero la medida la da al cuadrado, lo que carece de sentido en muchas ocasiones, por ejemplo, puntos cuadrados en una calificacin. Para eliminar este inconveniente se le halla el valor positivo de la raz cuadrada, y se obtendr la desviacin standart o tpica (S ), que es el valor a interpretar, y que significa que como promedio la mayora de los datos sedesvan de la media el valor obtenido (S)

El Coeficiente de Variacin es el ltimo de los estadgrafos de dispersin que estudiaremos, y es un parmetro relativo, es decir que se estudia el estadgrafo de una serie en relacin con otra, lo que nos permite comparar las dispersiones de dos o ms series de datos. En las investigaciones pedaggicas, cuando por ejemplo estamos realizando un experimento proyectado simultneo y necesitamos saber en cul de los dos grupos (experimental y de control) existe mayor dispersin. Si los valores de la media son aproximados, podemos lograrlo comparando las desviaciones tpicas, pero si difieren significativamente esta comparacin pierde credibilidad, entonces precisamos valernos de un estadgrafo relativo, y es donde empleamos el Coeficiente de Variacin (CV). Pruebas de hiptesis Son las pruebas estadsticas que se realizan para tomar decisiones en presencia dela incertidumbre. Por ejemplo, en un experimento pedaggico donde sometemos a verificacin la hiptesis de que al aplicar una nueva metodologa de la enseanza el grupo experimental obtendr un aprovechamiento acadmico significativamente superior; aplicamos una prueba de hiptesis, y si estadsticamente se niega la hiptesis nula de que el grupo experimental obtendr un aprovechamiento acadmico significativamente inferior al de control, la hiptesis sometida a verificacin se aceptar. Existen diferentes pruebas de hiptesis, nosotros trataremos en el presente texto una tpica utilizada en los experimentos pedaggicos, y es la prueba de X 2 (jjcuadrado) con tabla de contingencia. ___________________________________________________________________________

Anlisis de los Datos Coherencia con los objetivos y el diseo seleccionado. El anlisis de los datos en investigacin cuantitativa est compuesto por dos procedimientos indisolublemente vinculados : I) el tratamiento estadstico de los datos y II) la regla de inferencia. AMBOS DEBEN EXPLICITARSE EN TODO PROYECTO DE INVESTIGACION Tratamiento estadstico de los datos Definicin: El tratamiento estadstico de los datos est constituido acciones que consisten en la aplicacin de operaciones matemticas sobre el conjunto de los datos observados, obteniendo como resultado otro conjunto, cuyos elementos son nmeros que representan diversas propiedades Regla de inferencia. Definicin: Plan o criterio formulado previamente que establece que decisin se tomar con la hiptesis de la investigacin ante determinado subconjunto de los posibles resultados observables. El tratamiento estadsitico de los datos comprende Evaluacin de consistencia de los datos: consiste en la verificacin de que todos los datos almacenados en la base de datos correspondan solo a los valores posibles de las correspondientes variables, los cuales estn explicitados en su definicin operativa y corresponden a lo que se denomina Escala. La evaluacin de la consistencia de los datos implica en primer lugar I) la identificacin de valores fuera de la escala de la variable y seguidamente II) la identificacin de valores que, aunque dentro de la escala de medicin, son conceptualmente imposibles (es decir fcticamente imposibles) para la propiedad medida en la poblacin de estudio dentro del conocimiento establecido. No debe confundirse la identificacin y tratamiento de los valores imposibles con lo que algunos autores llaman outliers o valores extremos, los cuales aunque estn dentro de la escala y del rango de valores posibles de la variable, son valores atpicos, es decir de una magnitud muy poco frecuente. Este tipo de valores debe ser evaluado en el anlisis exploratorio. Ej: supngase un estudio biomedico en el que se pretende evaluar la relacin entre el peso y un marcador biologico proteico en varones adultos. La escala de peso se identifico como la de los nmeros reales positivos y la unidad el kg. En el proceso de evalucin se identifican datos como delgado obeso mrbido y no recuerda. Estos valores son carentes del significado que posee el conjunto de los valores que constituyen la escala: ser un nmero real positivo. Estos datos por lo tanto son eliminados. Por otra parte se detectan ademas los siguientes valores: 1500 y 0.03 . Si bien ambos nmeros se encuentran dentro de la escala numrica

de medicin de la variable, su magnitud no resulta aceptable dentro de la teora actual, por lo tanto el investigador debe tomar una decisin: se acepta que la teora vigente es incuestionable y establece los criterios para considerar un dato como facticamente imposible eliminando o rectificando toda observacin fuera de estos lmites, o luego de confirmarlo y considerndolo un valor extremo intenta establecer una explicacin del mismo buscando ms informacin, lo cual implica reformular o ampliar la teora. Evaluacin de datos faltantes: Se entiende por dato faltante a la ausencia de valores en un conjunto de observaciones. La evaluacin de datos faltantes implica I) evaluacion de la magnitud de datos faltantes y II) evaluacin del patrn de datos faltantes Anlisis exploratorio: el anlisis exploratorio de los datos es una aproximacin al anlisis de los datos que emplea una serie de tcnicas estadsticas, en su mayora grficas, para identificar la distribucin de los mismos con el objetivo de: I) verificar el cumplimiento de los supuestos estadsticos, II) detectar valores atpicos, III) evidenciar una estructura subyacente, IV) desarrollar modelos parsimoniosos Descripcin estadstica e Inferencia estadstica: el tratamiento estadstico de los datos pretende efectuar conclusiones. Segn si estas conclusiones se refieran a los hechos observados o se las pretenda aplicar a situaciones no observadas se pueden distinguir dos tipos de tratamiento de datos I) Descripcin estadstica: es la aplicacin de procedimientos matemticos sobre un conjunto de datos observados con la finalidad de aprehender su distribucin expresandola mediante medidas de resumen. El objetivo de la descripcin estadstica es capturar la estructura de un hecho concreto expresando lo mediante diversas magnitudes de resumen. Ej: el director de un hospital desa saber la composicion de las internaciones en unidad coronaria en el ao 2009 para planificar las compras del ao siguiente. Consulta el archivo de internaciones tabulando los diagnsticos de motivo de ingreso. Encuentra que de 1000 hospitalizaciones 650 fueron secundarias a sndrome coronario agudo, 250 a insuficiencia cardaca, 80 a trastornos del ritmo y 20 a cusas varias. Sus conclusiones fueron que la causa ms frecuente de internacin, el 65 %, se debi a enfermeda coronaria. No requiere efectuar ningn procedimiento adicional, siendo su pretensin establecer una conclusin respecto de la diferencia de dos magnitudes ocurridas en un hecho concreto, el nico procedimiento requerido es la medicion confiable de cada uno de ellos y el criterio de decisin ser el de la diferencia absoluta observada entre ambas magnitudes. II) Inferencia Estadstica: es la aplicacin de procedimientos matemticos sobre un conjunto de datos observados con la finalidad de aprehender la estructura no observada que los gener, expresndola mediante un conjunto de parmetros en un modelo de probabilidad. Estrictamente la inferencia estadstica consiste en la formulacin de una afirmacin respecto del modelo de probabilidad subyacente a la estructura de la realidad en cuestin. La Regla de inferencia Es la explicitacin del criterio que establece cual ser la conclusin de la investigacin (aceptacin o rechazo de la hiptesis del estudio) segn los hechos que se observen en la misma. Cuando la conclusin del estudio es respecto de una ley general, es decir que se aplica a situaciones no observadas ms all de los hechos del estudio, la regla de inferencia es una regla de inferencia estadstica

Potrebbero piacerti anche