Sei sulla pagina 1di 26

Mlnerla de uaLos

Apllcada
ConcepLos lundamenLales y
uomlnlos de Apllcacln
ullses C
Cue es la mlnerla de daLos? .
Ll mundo es rlco en
canudad de daLos, pero
pobre en lnformacln.
ullses C
La Mlnerla de daLos conslsLe en la
busqueda de conoclmlenLo
(paLrones) en los daLos, que
permlLan Lomar declslones.
. Cue es la mlnerla de daLos?
ullses C
ara que apllcar Mlnerla de uaLos?
Apllcaclones
Claslcacln.
Agrupacln de uaLos.
redlccln numerlca.
SlnLesls auLomauzada.
Modelos de dependencla.
ullses C
luenLes de daLos
ullses C
roceso de exLraccln de conoclmlenLo (kuu)
ullses C
uaLos orlglnales
uaLos
orlglnales
ullses C
Archlvos de uaLos
!"#$% '( )*+,-+" ./,012"% '( 3(43"
Archlvos de LexLo
Po[as de clculo
8ases de daLos de
dlferenLes fuenLes:
CL1, CLA, Access, eLc.
8epresenLacln de los daLos
un aLrlbuLo represenLa una caracLerlsuca de un
ob[eLo. Algunos slnnlmos de aLrlbuLo son
dlmensln, caracLerlsuca, rasgo o varlable.
8epresenLacln
d
ullses C
Seleccln de uaLos
uaLos
selecclonados
ullses C
Seleccln de los daLos
Cue daLos se neceslLan para el anllsls?
Se debe conslderar:
! La fuenLe de los daLos.
! Los lnsLrumenLos de recoleccln.
! Ll upo de uaLos.
! Con[unLo de uaLos suclenLemenLe grande.
ullses C
Anadlr una llnea de producLos
Camblar el preclo de un
producLo
Camblar el calendarlo
de publlcldad
AumenLar la Lasa
presupuesLal
lncremenLar el llmlLe de
credlLo de un cllenLe
lncremenLar el nlvel de salarlo
de un cllenLe
56 '( 7/"'-,3"%
56 '( 7-8+1,1'$'
56 '(9":/*;,$ '(
,+1(<3(%
CL1
(rocesamlenLo de 1ransacclones en Llnea)
CunLos
producLos
vendleron ms de
$10,000 en el rea
elecLrnlca el mes
pasado?
Sl los nlveles de
lnvenLarlo ba[aron
un 10, que
cllenLes aun
podrlan segulr
comprando?
odrla el perl de
los cllenLes,
soporLar una alza
en los preclos?
CLA
(rocesamlenLo Analluco en Llnea)
Almacen
de
uaLos
lnLegracln de los uaLos.
ullses C
reprocesamlenLo de los uaLos
uaLos
preprocesados
ullses C
Llmpleza de los uaLos
valores lalLanLes
uaLos con ruldo
ulferenLe escala numerlca
valores exLremos
8eglsLros dupllcados
ullses C
8educcln de dlmenslonalldad
R
2

R
3
Se reere al proceso de reduccln de las
varlables o aLrlbuLos a conslderar. uede
dlvldlrse en Seleccln y LxLraccln de
aLrlbuLos.
ullses C
Seleccln de ALrlbuLos
Se reere al proceso de seleccln de caracLerlsucas,
Lamblen conocldo como seleccln de varlables=
ConslsLe en selecclonar un subcon[unLo de
caracLerlsucas relevanLes para la consLruccln del
modelo.
La asuncln prlnclpal para el uso de Lecnlcas de
seleccln es que los daLos conuenen muchas
caracLerlsucas redundanLes y/o lrrelevanLes.
ullses C
LxLraccln de CaracLerlsucas
Sl las caracLerlsucas exLraldas son selecclonadas culdadosamenLe, se espera que
dlcho subcon[unLo represenLe un exLracLo de la lnformacln orlglnal y con esLe se
pueda reallzar la Larea deseada (Agrupacln de daLos/Claslcacln).
8
e
c
o
n
o
c
l
m
l
e
n
L
o

d
e

r
o
s
L
r
o
s

8
e
c
o
n
o
c
l
m
l
e
n
L
o

d
e

h
u
e
l
l
a
s

d
a
c
u
l
a
r
e
s

8econoclmlenLo de caracLeres
R
2

R
3

Ll proceso de exLraccln lmpllca,
generalmenLe, una reduccln en la
canudad de aLrlbuLos (dlmensln)
ullses C
Mlnerla (ConsLruccln del Modelo)
aLrones
ullses C
Agrupacln de uaLos
La agrupacln de daLos, Lamblen conoclda como anllsls de grupos, anllsls de
segmenLacln, o claslcacln no supervlsada, es un meLodo que uene como ob[euvo
crear grupos de ob[eLos, de Lal forma que los ob[eLos de un grupo sean muy slmllares
enLre sl, y dlsunLos a los de oLros grupos.
vlsuallzacln en 2u de daLos agrupados vlsuallzacln en 3u de daLos agrupados
ullses C
Claslcacln
uada una funcln desconoclda
que mapea lnsLanclas de la enLrada
a euqueLas de sallda
para un con[unLo de enLrenamlenLo
,
se preLende crear un modelo
que se aproxlme, LanLo como sea poslble, al
mapeo correcLo de .
h
x
i
y
i
ullses C
Claslcacln | L[emplo 1
Ll empleado de un banco neceslLa anallzar sus daLos con el
ob[euvo de deLermlnar cuales de sus cllenLes son conables para
un presLamo y cuales represenLan un rlesgo.

Conable

8lesgoso
Datos
personales
Historial
Crediticio
h
X
Y
ullses C
Claslcacln | L[emplo 2
un empleado del deparLamenLo de markeung neceslLa anallzar
sus daLos con el ob[euvo de deLermlnar cuales de sus cllenLes
son poLenclales para la compra de una compuLadora y cuales no.
h
X
Y
Comprador

no comprador
Datos
personales
Registros de
compras
ullses C
Claslcacln | L[emplo 3
un medlco que reallza una lnvesugacln, desea anallzar daLos de esLudlos en
paclenLes con cncer de seno, con el ob[euvo de predeclr cual de Lres
LraLamlenLos especlcos deben reclblr los paclenLes.
h
X=
Y
1raLamlenLo A"
1raLamlenLo 8"
1raLamlenLo C"
Resultados
de Estudios
mdicos
ullses C
Lvaluacln
kuu
ConoclmlenLo
ullses C
Lvaluacln de algorlLmos de Claslcacln
una vez enLrenado un claslcador o
predlcLor, es lmporLanLe esumar
que Lan preclso es, o compararlo
con oLros modelos consLruldos para
la mlsma Larea. Sobre Lodo para
daLos desconocldos. Ls declr, daLos
que no fueron uullzados duranLe la
fase de enLrenamlenLo.
h
1
X
Y
h
2
X
Y
h
3
X
Y
ullses C
Lvaluacln de AlgorlLmos para Agrupacln
ara comparar el desempeno de dlferenLes algorlLmos de Agrupacln de uaLos, son
necesarlos los crlLerlos de valldacln. lncluso con un mlsmo algorlLmo, la evaluacln es
un proceso no Lrlvlal para deLermlnar la canudad puma de grupos.
ullses C

Potrebbero piacerti anche