Sei sulla pagina 1di 42

Práctica 1

Intro MATLAB

Descrip. datos

Rep. Gráfica

Medidas de
posición
Estadı́stica Descriptiva1 con
Medidas de
dispersión
MATLAB/Octave
Descrip. 2 Ingenierı́a de Telecomunicaciones
variables

Departamento de Estadı́stica

Universidad Carlos III de Madrid

Curso 2009/2010

1 Consultar ficheros Descriptiva 1 y Descriptiva 2


1 / 42
Práctica 1

Resumen de la práctica
Intro MATLAB

Descrip. datos

Rep. Gráfica

Medidas de 1 Introducción entorno MATLAB/Octave


posición

Medidas de
dispersión

Descrip. 2
2 Descripción de un conjunto de datos
variables

3 Representación gráfica

4 Medidas de posición

5 Medidas de dispersión

6 Descripción conjunta de dos variables

2 / 42
Práctica 1

Resumen
Intro MATLAB

Descrip. datos

Rep. Gráfica

Medidas de 1 Introducción entorno MATLAB/Octave


posición

Medidas de
dispersión

Descrip. 2
2 Descripción de un conjunto de datos
variables

3 Representación gráfica

4 Medidas de posición

5 Medidas de dispersión

6 Descripción conjunta de dos variables

3 / 42
Práctica 1

Ventana Principal de MATLAB


Intro MATLAB

Descrip. datos

Rep. Gráfica

Medidas de Current Directory


posición

Medidas de
dispersión

Descrip. 2
variables Workspace
Command Window

Command History

4 / 42
Práctica 1

Directorio actual de Trabajo (Current Directory):


Intro MATLAB Especificar la ruta: C:/.../
Descrip. datos

Rep. Gráfica
por ejemplo: C:/practica1/
Medidas de
posición Aquı́ se guardan las funciones *.m creadas
Medidas de
dispersión
Espacio de Trabajo (Workspace).
Descrip. 2 Aquı́ aparecen las variables o funciones cargadas.
variables

Ventana de comandos (Command Window).


Consola sobre la que se escriben los comandos.
Historial de comandos (Command History).
Aquı́ se guardan los comandos escritos en la consola.

Ficheros práctica 1
Para esta práctica descarga de la página web los ficheros
internet.mat, AlumnosIndustriales.mat y histg.m del siguiente
enlace

5 / 42
Práctica 1

Resumen
Intro MATLAB

Descrip. datos

Rep. Gráfica

Medidas de 1 Introducción entorno MATLAB/Octave


posición

Medidas de
dispersión

Descrip. 2
2 Descripción de un conjunto de datos
variables

3 Representación gráfica

4 Medidas de posición

5 Medidas de dispersión

6 Descripción conjunta de dos variables

6 / 42
Práctica 1

Ejemplo: averı́as
Intro MATLAB

Descrip. datos

Rep. Gráfica Los datos sobre el número de averı́as de 40 centrales se recogen en la


Medidas de siguiente tabla (incompleta):
posición

Medidas de
dispersión

Descrip. 2
Central Eléctrica No Averı́as
variables
1 1
2 3
3 2
4 2
.. ..
. .
39 1
40 2

7 / 42
Práctica 1

Ejemplo: averı́as
Intro MATLAB

Descrip. datos

Rep. Gráfica
En MATLAB, introducimos los datos sobre el command window
Medidas de
posición

Medidas de >> averias=[ 1; 3; 2; 2; 0; 3; 1; 0; 2; 1; 0; 1; 0; 3; 0; 2;


dispersión
0; 2; 1; 1; 1; 0; 2; 3; 0; 0; 0; 0; 1; 1; 4; 0;
Descrip. 2
variables
3; 1; 0; 2; 1; 1; 1; 2 ]

El resultado es el vector columna averias

averias =

1
3
2
2
...

8 / 42
Práctica 1

Ejemplo: averı́as
Intro MATLAB

Descrip. datos

Rep. Gráfica

Medidas de
El comando tabulate, calcula las frecuencias absolutas (Count) y
posición
relativas (en %) (Percent)
Medidas de
dispersión

Descrip. 2 >> tabulate(averias)


variables

Value Count Percent


0 13 32.50%
1 13 32.50%
2 8 20.00%
3 5 12.50%
4 1 2.50%

9 / 42
Práctica 1

Ejemplo: averı́as
Intro MATLAB
Para trabajar con la tabla como una matriz, la guardamos con el
Descrip. datos

Rep. Gráfica
nombre de tabla. De este modo podemos manejar sencillamente sus
Medidas de
elementos.
posición

Medidas de >> tabla = tabulate(averias)


dispersión

Descrip. 2
variables Por ejemplo, podemos expresar las frecuencias relativas entre 0 y 1,
en lugar de en %

>> tabla(:,3) = tabla(:,3)/100

tabla =

0 13.0000 0.3250
1.0000 13.0000 0.3250
2.0000 8.0000 0.2000
3.0000 5.0000 0.1250
4.0000 1.0000 0.0250

10 / 42
Práctica 1

Ejemplo: averı́as
Intro MATLAB

Descrip. datos
Podemos calcular las frecuencias acumuladas con el comando cumsum
Rep. Gráfica

Medidas de
posición
>> abs_acum = cumsum(tabla(:,2))
Medidas de
ans =
dispersión 13
Descrip. 2
variables
26
34
39
40

>> rel_acum = cumsum(tabla(:,3))


ans =
0.3250
0.6500
0.8500
0.9750
1.0000

11 / 42
Práctica 1

Ejemplo: averı́as
Intro MATLAB

Descrip. datos

Rep. Gráfica

Medidas de
La tabla final de frecuencias se puede construir, juntando las
posición columnas de las frecuencias acumuladas (abs acum y rel acum a la
Medidas de
dispersión
tabla anterior)
Descrip. 2
variables
>> tabla=[ tabla abs_acum rel_acum ]

tabla =

0 13.0000 0.3250 13.0000 0.3250


1.0000 13.0000 0.3250 26.0000 0.6500
2.0000 8.0000 0.2000 34.0000 0.8500
3.0000 5.0000 0.1250 39.0000 0.9750
4.0000 1.0000 0.0250 40.0000 1.0000

12 / 42
Práctica 1

Ejemplo: averı́as
Intro MATLAB

Descrip. datos

Rep. Gráfica
¿Cuántas centrales tienen menos de 2 averı́as ?
Medidas de
posición

Medidas de
dispersión

Descrip. 2 No Averias Frec Abs Frec Rel Frec Abs Acum Frec Rel Acum
variables

0 13 0.325 13 0.325
1 13 0.325 26 0.650
2 8 0.200 34 0.850
3 5 0.125 39 0.975
4 1 0.025 40 1

13 / 42
Práctica 1

Ejemplo: averı́as
Intro MATLAB

Descrip. datos

Rep. Gráfica
¿Qué porcentaje de centrales tiene 3 ó menos averı́as?
Medidas de
posición

Medidas de
dispersión

Descrip. 2 No Averias Frec Abs Frec Rel Frec Abs Acum Frec Rel Acum
variables
0 13 0.325 13 0.325
1 13 0.325 26 0.650
2 8 0.200 34 0.850
3 5 0.125 39 0.975
4 1 0.025 40 1

14 / 42
Práctica 1

Ejemplo: averı́as
Intro MATLAB

Descrip. datos

Rep. Gráfica ¿Qué cantidad de averı́as es tal que al menos el 50 % de las centrales
Medidas de
posición
tiene una cantidad de averı́as inferior o igual a esa?
Medidas de
dispersión

Descrip. 2
variables No Averias Frec Abs Frec Rel Frec Abs Acum Frec Rel Acum
0 13 0.325 13 0.325
1 13 0.325 26 0.650 ≥50 %

2 8 0.200 34 0.850
3 5 0.125 39 0.975
4 1 0.025 40 1

15 / 42
Práctica 1

Resumen
Intro MATLAB

Descrip. datos

Rep. Gráfica

Medidas de 1 Introducción entorno MATLAB/Octave


posición

Medidas de
dispersión

Descrip. 2
2 Descripción de un conjunto de datos
variables

3 Representación gráfica

4 Medidas de posición

5 Medidas de dispersión

6 Descripción conjunta de dos variables

16 / 42
Práctica 1

Representación gráfica
Intro MATLAB
Variables cuantitativas
Descrip. datos

Rep. Gráfica

Medidas de
posición

Medidas de Algunos gráficos son diferentes en función de que las variables


dispersión
sean discretas o continuas.
Descrip. 2
variables
Se utilizan con frec. absolutas o relativas y acumuladas.

Diagrama de barras
Gráfico de tarta, de sectores o pictograma
Histograma

17 / 42
Práctica 1

Representación gráfica
Intro MATLAB
Variables cuantitativas
Descrip. datos

Rep. Gráfica

Medidas de
posición
Ejemplo: averı́as en centrales eléctricas
Medidas de
dispersión

Descrip. 2
variables
Diagrama de barras:
En MATLAB utilizamos el comando bar
14

12

10
>> bar(tabla(:,2))
8

obtenemos el diagr. de barras de 6

frec. absolutas 4

0
1 2 3 4 5

18 / 42
Práctica 1

Representación gráfica
Intro MATLAB
Variables cuantitativas
Descrip. datos

Rep. Gráfica

Medidas de
posición Ejemplo: averı́as en centrales eléctricas
Medidas de
dispersión Diagrama de tarta, sectores o pictograma:
Descrip. 2
variables En MATLAB utilizamos el comando pie
3%

13%

33%

>> pie(tabla(:,2)) 20%

33%

19 / 42
Práctica 1

Representación gráfica
Intro MATLAB
Variables cuantitativas
Descrip. datos

Rep. Gráfica Ejemplo: alturas de alumnos


Medidas de
posición Histograma:
Medidas de
dispersión La variable alturas, recoge los datos sobre la altura de 28 alumnos
Descrip. 2 en una clase.
variables

alturas = [ 156; 159; 153; 157; 162; 156; 162;


153; 158; 152; 153; 159; 154; 153;
150; 162; 163; 160; 162; 156; 164;
168; 152; 151; 159; 147; 165; 149 ]
6

Comando hist 4

>> hist(alturas) 2

0
145 150 155 160 165 170

20 / 42
Práctica 1

Intro MATLAB

Descrip. datos Podemos seleccionar el número de clases o intervalos que deseemos


Rep. Gráfica

Medidas de >> hist(alturas, 5) % 5 clases o intervalos


posición
8
Medidas de
dispersión
7
Descrip. 2
variables 6

0
145 150 155 160 165 170

21 / 42
Práctica 1 Supongamos que en la clase se incorpora un nuevo alumno que mide
2.10 metros
Intro MATLAB
Creamos una nueva variable alturas2
Descrip. datos

Rep. Gráfica
>> alturas2 = [alturas; 210];
Medidas de
posición >> hist(alturas2,5)
Medidas de
dispersión 10

Descrip. 2 9
variables
8

0
140 150 160 170 180 190 200 210

El nuevo alumno es un dato atı́pico


22 / 42
Práctica 1

Diagrama para frec. acum.


Intro MATLAB

Descrip. datos Ejemplo: averı́as centrales eléctricas


Rep. Gráfica

Medidas de Nos centramos en las frecuencias absolutas y absolutas acumuladas


posición
De la variable tabla representamos las columnas 2 y 4
Medidas de
dispersión

Descrip. 2 >> bar([tabla(:,2) tabla(:,4)])


variables
40

Frec. Abs
35
Frec. Abs Acum.

30

25

20

15

10

0
1 2 3 4 5

23 / 42
Práctica 1

Resumen
Intro MATLAB

Descrip. datos

Rep. Gráfica

Medidas de 1 Introducción entorno MATLAB/Octave


posición

Medidas de
dispersión

Descrip. 2
2 Descripción de un conjunto de datos
variables

3 Representación gráfica

4 Medidas de posición

5 Medidas de dispersión

6 Descripción conjunta de dos variables

24 / 42
Práctica 1

Medidas de posición
Intro MATLAB
media, mediana
Descrip. datos

Rep. Gráfica

Medidas de Ejemplo: alturas de alumnos


posición

Medidas de
dispersión Volviendo al ejemplo anterior alturas2
Descrip. 2
variables La media x̄, comando mean:

>> mean(alturas2)
ans =
156.9643
La mediana xmed , comando median:

>> median(alturas2)
ans =
156.5000

25 / 42
Práctica 1

Resumen
Intro MATLAB

Descrip. datos

Rep. Gráfica

Medidas de 1 Introducción entorno MATLAB/Octave


posición

Medidas de
dispersión

Descrip. 2
2 Descripción de un conjunto de datos
variables

3 Representación gráfica

4 Medidas de posición

5 Medidas de dispersión

6 Descripción conjunta de dos variables

26 / 42
Práctica 1

Medidas de dispersión
Intro MATLAB
varianza, desviación tı́pica y rango
Descrip. datos

Rep. Gráfica

Medidas de Miden la “dispersión” de las observaciones dentro del conjunto de


posición
datos respecto de alguna medida de posición.
Medidas de
dispersión
Varianza:
Descrip. 2 n
1X
VARx = Sx2 = (xi − x̄)2
variables

n
i

Desviación tı́pica:
p
DTx = Sx = Sx2

Rango ó amplitud:

Rangox = máx(xi ) − mı́n(xi )

27 / 42
Práctica 1

Intro MATLAB

Descrip. datos En MATLAB


Rep. Gráfica

Medidas de Comando var


posición

Medidas de >> var(x)


dispersión

Descrip. 2
Comando std
variables
>> std(x)
Comando range
>> range(x)
O también con los comandos max y min, es decir:
max(x)-min(x).

28 / 42
Práctica 1

Resumen
Intro MATLAB

Descrip. datos

Rep. Gráfica

Medidas de 1 Introducción entorno MATLAB/Octave


posición

Medidas de
dispersión

Descrip. 2
2 Descripción de un conjunto de datos
variables

3 Representación gráfica

4 Medidas de posición

5 Medidas de dispersión

6 Descripción conjunta de dos variables

29 / 42
Práctica 1

Ejemplo: longitud/peso
Intro MATLAB

Descrip. datos
Se ha medido la longitud (X en mm) y el peso (Y en gr) de una
Rep. Gráfica muestra de 117 tornillos producidos por una máquina, la información
Medidas de se representa en la siguiente tabla:
posición

Medidas de nij
dispersión

Descrip. 2
variables
X/Y 40-60 60-80 80-100 100-200
140-160 4 0 0 0
160-180 14 60 2 0
180-200 0 20 16 1

>> tornillos = [ 4 0 0 0
14 60 2 0
0 20 16 1 ]

30 / 42
Práctica 1

Ejemplo: longitud/peso
Intro MATLAB

Descrip. datos
Se ha medido la longitud (X en mm) y el peso (Y en gr) de una
Rep. Gráfica muestra de 117 tornillos producidos por una máquina, la información
Medidas de se representa en la siguiente tabla:
posición

Medidas de nij
dispersión

Descrip. 2
variables
X/Y 40-60 60-80 80-100 100-200
140-160 4 0 0 0
160-180 14 60 2 0
180-200 0 20 16 1

>> tornillos = [ 4 0 0 0
14 60 2 0
0 20 16 1 ]

31 / 42
Práctica 1

Podemos calcular la tabla de frecuencias relativas, simplemente


Intro MATLAB
nij
Descrip. datos
fij = n
Rep. Gráfica

Medidas de
posición >> frec_relat = tornillos/117
Medidas de
dispersión

Descrip. 2
variables

X/Y 40-60 60-80 80-100 100-200


140-160 0.0342 0 0 0
160-180 0.1197 0.5128 0.0171 0
180-200 0 0.1709 0.1368 0.0085

32 / 42
Práctica 1

Podemos calcular las distribuciones marginales sumando por filas y


Intro MATLAB por columnas:
Descrip. datos

Rep. Gráfica Por filas (1) y por columnas (2):


Medidas de
posición

Medidas de
>> sum(tornillos,1) >> sum(tornillos,2)
dispersión ans = ans =
Descrip. 2
variables
18 80 18 1 4
76
37

X/Y 40-60 60-80 80-100 100-200 Total


140-160 4 0 0 0 4
160-180 14 60 2 0 76
180-200 0 20 16 1 37
Total 18 80 18 1 117

33 / 42
Práctica 1

Ejemplo: internet
Intro MATLAB

Descrip. datos

Rep. Gráfica En una encuesta realizada por dos empresas de servicios de internet
Medidas de
posición
sobre 95 hogares con conexión a internet, se han analizado las
Medidas de
siguientes variables:
dispersión

Descrip. 2
variables
MB: MB’s descargados al dı́a.
Tiempo de Conexión: tiempo medio de conexión diario en
horas.
ISP: Internet Service Provider (proveedores 1 y 2).
Momento: momento principal de conexión (Mañana=1,
Tarde=2, Noche=3).

Los datos se encuentran en el fichero internet.mat

34 / 42
Práctica 1

Ejemplo: internet
Intro MATLAB

Descrip. datos
Tabla de datos (incompleta):
Rep. Gráfica

Medidas de
posición

Medidas de MB Tiempo conexion ISP Momento


dispersión

Descrip. 2 163 1,1 1 1


variables
170 3,5 1 1
169 3 1 3
173 2 1 2
160 1,1 1 1
.. .. .. ..
. . . .
183 8,1 2 1
175 5,6 2 3
173 3 2 1

35 / 42
Práctica 1

Ejemplo: Internet
Intro MATLAB

Descrip. datos

Rep. Gráfica

Medidas de
Para importar el fichero en MATLAB:
posición

Medidas de
dispersión
File → Open ó tambien File → Import data
Descrip. 2
variables Una vez importados los datos, en el workspace tenemos creada
la matriz internet
Para nombrar las variables:

>> MB = internet(:,1);
>> tiempo_conexion = internet(:,2);
>> ISP = internet(:,3);
>> momento = internet(:,4);

36 / 42
Práctica 1

Ejemplo: Internet
Intro MATLAB

Descrip. datos

Rep. Gráfica
Con el comando crosstab, podemos trabajar con tablas de
Medidas de
posición doble entrada, por ejemplo, para las variables cualitativas
Medidas de momento e ISP, podemos crear la matriz de tamaño 3 × 2. En la
dispersión
que las filas representan las tres categorı́as de la variable
Descrip. 2
variables momento (1= mañana, 2 = tarde y 3 = noche) y las columnas
los dos tipos de proveedores ISP

>> crosstab(momento,ISP)
ans =
3 10
11 25 ISP
18 28 MOMENTO 1 2
mañana 3 10
tarde 11 25
noche 18 28

37 / 42
Práctica 1

Ejemplo: Internet
Intro MATLAB
Histograma por grupos
Descrip. datos

Rep. Gráfica El fichero histg.m permite representar gráficamente un


Medidas de
posición
histograma por grupos.
Medidas de
dispersión
Guardaremos el fichero en el directorio C:/practica1/
Descrip. 2
variables

>> histg(MB,ISP)
ISP 1
ISP 2
0.3

0.25

0.2

0.15

0.1

0.05

0
155 160 165 170 175 180 185 190 195 200

38 / 42
Práctica 1

Ejemplo: Internet
Intro MATLAB
Análisis por grupos
Descrip. datos

Rep. Gráfica

Medidas de
posición

Medidas de
dispersión
El comando grpstats permite calcular estadı́sticas por grupos.
Descrip. 2
variables GRPSTATS(X,GROUP) calcula la media de los grupos.

[MEANS,SEM,COUNTS,GNAME] = GRPSTATS(X,GROUP), calcula


las medias (MEANS), desviaciones tı́picas (SEM), el número de
elementos en cada grupo (COUNTS), y el nombre de cada grupo
(GNAME)

39 / 42
Práctica 1

Ejemplo: Internet
Intro MATLAB
Análisis por grupos
Descrip. datos

Rep. Gráfica

Medidas de
posición
>> [MEANS,SEM,COUNTS,GNAME]=grpstats(MB,ISP)
Medidas de
dispersión MEANS =
Descrip. 2 165.3125
variables 179.3492

SEM =
0.7834
0.6345

COUNTS =
32
63

GNAME =
’1’
’2’

40 / 42
Práctica 1

Ejemplo: Internet
Intro MATLAB
gráfico de dispersión
Descrip. datos

Rep. Gráfica Con la función plot, podemos representar un gráfico de


Medidas de
posición
dispersión de dos variables cuantitativas, por ejemplo, para las
Medidas de variables MB y tiempo conexion:
dispersión

Descrip. 2
variables
>> plot(MB,tiempo_conexion)

12

10

0
155 160 165 170 175 180 185 190 195

¿Existe una relación lineal entre MB y tiempo conexion? ¿existe


dependencia lineal?

41 / 42
Práctica 1

Ejemplo: Internet
Intro MATLAB
covarianza y correlación
Descrip. datos

Rep. Gráfica

Medidas de
El comando cov, calcula la matriz de covarianzas
posición

Medidas de >> cov(MB,tiempo_conexion)


dispersión
ans =
Descrip. 2
variables 67.6847 13.8172
13.8172 4.7746 
Sx2 Sx,y

COV (X , Y ) =
Sx,y Sy2

El comando corrcoef, calcula el coefficiente de correlación.

>> corrcoef(MB,tiempo_conexion)
ans =
1.0000 0.7686  
0.7686 1.0000 r rx,y
CORR(X , Y ) = x,x
rx,y ry ,y
donde rx,y = SSxx,y
Sy
.

42 / 42

Potrebbero piacerti anche