Sei sulla pagina 1di 4

SET.

2019 EDICIÓN 1

LAS TÉCNICAS EN LA MINERÍA


DE DATOS
Editor: Lic. Marco Antonio Cubillo Murray

CONTENIDO DE LA EDICIÓN
LAS TÉCNICAS
Lic. Marco A. Cubillo M. Análisis Factoriales
Descriptivos
Se pretendemos resolver cualquier problema debemos tener muy
Market Basket Analysis
claro que no existe una única técnica y que deben ser abordados
(Análisis de la Cesta de la
utilizando la técnica que mejor se adapte para hacerle frente.
Compra)
La cantidad de técnicas con la aplicación del enfoque de la Minería Técnicas de Clustering
de Datos es grande y se espera que en un futuro las mismas Series Temporales
crezcan. Redes Bayesianas
Modelos Lineales
Es aquí donde debemos tener bien claro la naturaleza del problema
Generalizados
que vamos a analizar, así podremos seleccionar de una forma más
Previsión Local
precisa cuál técnica se adapta mejor en la búsqueda de una
Redes Neuronales
solución más eficiente y exacta.
Árboles de Decisión
Vamos entonces a repasar algunas de las técnicas que en la Algoritmos Genéticos
actualidad podemos usar y que están incorporadas en la mayoría de Poder de Generalización
los programas que nos permiten llevar a cabo una Minería de Datos Escalabilidad
de forma óptima.
ANÁLISIS FACTORIALES DESCRIPTIVOS
Lic. Marco A. Cubillo M.

Este tipo de análisis nos permite eventuales discrepancias con


crear visualizaciones de realidades respecto de aquella y por supuesto
multivariantes complejas de podremos sugerir hipótesis de
manera que podremos revelar las explicación.
regularidades estadísticas y las

MARKET BASKET ANALYSIS


Lic. Marco A. Cubillo M.

Análisis de la canasta de la localización y la forma de pago


compra, como se le conoce en entre otros, sobre el
español, nos permite detectar que comportamiento de la compra.
productos se compran de forma También nos ayuda aplicarse en
conjunta, agregando información contextos variados como el e-
técnicas para poder interpretar los comercio e incorporarle el factor
datos como: día, semana, temporal.

TÉCNICAS DE CLUSTERING
Lic. Marco A. Cubillo M.

Son las técnicas que inician con de individuos más semejantes entre
una medida de aproximidad entre sí, claro según una serie de
individuos para buscar los grupos variables medibles.

SERIES TEMPORALES
Lic. Marco A. Cubillo M.

A partir de la serie de predecir el futuro, tales como cifre


“Los datos son el activo comportamiento histórico podemos de ventas, previsión de consumo de
estratégico de las modelizar las componentes básicas un producto o un servicio.
compañías por de la serie, tendencia, ciclo y
estacionalidad, con el fin de
excelencia».
Christian Gardiner.

«Los datos son el petróleo


del siglo XXI. El despliegue
de sensores y el
incremento de la capacidad
del procesamiento, son
claves en la transformación
de muchos sectores y en la
creación de un mundo más
medible y programable”.
Cesar Alierta.
REDES BAYESIANAS
Lic. Marco A. Cubillo M.

Sirven para representar todos los sucesos. Se puede codificar a partir


posibles sucesos en que estamos del conocimiento de un experto o se
interesados mediante un grafo de puede inferir a partir de los datos.
probabilidades condicionales de También nos permite poder
transición entre los posibles establecer relaciones causales.

MODELOS LINEALES GENERALIZADOS


Lic. Marco A. Cubillo M.

Son modelos que permiten el Además los modelos estadísticos


manejo de distintos tipos de se enriquecen cada vez más y se
variables de respuesta, por hacen más flexibles y adaptativos,
ejemplo la preferencia entre ciertos lo que permite abordar los
productos concurrentes en el problemas cada vez más complejos
mercado. de una forma más eficiente.

PREVISIÓN LOCAL
Lic. Marco A. Cubillo M.

Se trata de que individuos La técnica es situar los individuos


parecidos tendrán en un espacio euclídeo y hacer las
comportamientos similares predicciones de su comportamiento
respecto de una cierta variable de a partir del comportamiento
respuesta. observado en sus vecinos.

REDES NEURONALES
Tradicionalmente el
objetivo de la minería era la
obtención de carbón. No Lic. Marco A. Cubillo M.
obstante, una nueva
Se inspiran en un modelo linealidad del modelo.Nos permite
generación de mineros ha
biológico, consisten en modelos aprender en contextos difíciles, sin
aparecido en el inicio de
estadísticos clásicos. Si diferencia necesidad de precisar la
esta cuarta revolución radica en el aprendizaje formulación de un modelo en
industrial. Son los mineros secuencial, en el hecho de utilizar concreto. Su principal
o exploradores de datos, transformaciones de las variables inconveniente es que para el
que cuales en lugar de originales para la predicción y la no usuario son una caja negra.

buscar carbón intentan


descubrir patrones en
enormes volúmenes de
datos. Los métodos
utilizados de estos nuevos
profesionales son
la inteligencia artificial, el
aprendizaje automático, la
estadística y sistemas de
base de datos.
ARBÓLES DE DECISIÓN
Lic. Marco A. Cubillo M.

Obtenemos las reglas de decisión comparado con datos históricos,


bajo las cuales operan los brindando una facilidad de
consumidores, interpretacion.

ALGORÍTMOS GENÉTICOS
Lic. Marco A. Cubillo M.

Simulamos el modelo biológico de resolverse mediante algorítmos


la evolución de las especies, claro genéticos. Una opción es mezclar
a velocidades muy grandes. los análisis en sistemas híbridos, o
Su principio es que cualquier sea combinando la eficiencia en la
problema que se nos presente, resolución de un problema, por
como la optimización de una ejemplo usar un algorítmo genético
combinación entre distintas para iniciar una red neuronal o usar
componentes, estando claro un árbol de decisión como variable
sujetas a restricciones, puede de entrada en una regresión
logística.

PODER DE GENERALIZACIÓN
Lic. Marco A. Cubillo M.

Implica implementar técnicas modelo o por métodos


eficientes de validación de computacionales como la validación
resultados, a partir del cruzada.
conocimiento de la distribución
Tradicionalmente el muestral de los estadísticos del

ESCALABILIDAD
objetivo de la minería era la
obtención de carbón. No
obstante, una nueva Lic. Marco A. Cubillo M.
generación de mineros ha
Dado el volumen de datos a tratar, respecto de los parámetros que
aparecido en el inicio de
el costo de los algorítmos ha de definen el costo, en particular
esta cuarta revolución
ser todo líneal que sea posible respecto del número de individuos.
industrial. Son los mineros
o exploradores de datos,
que cuales en lugar de
buscar carbón intentan
descubrir patrones en
enormes volúmenes de
datos. Los métodos
utilizados de estos nuevos
profesionales son
la inteligencia artificial, el
aprendizaje automático, la
estadística y sistemas de
base de datos.

Potrebbero piacerti anche