Sei sulla pagina 1di 1

Tarea 1

Donovan Olmedo Martínez ID: 00235491


En los últimos años ha habido un gran crecimiento del campo de Minería de Datos. Se
realizado esfuerzos para buscar el establecimiento de estándares en el área. Incluido en
estos esfuerzos se pueden enumerar SEMMA y CRISP-DM.
Ambos estándares industriales y definen un conjunto de pasos secuenciales que pretende
guiar la implementación de aplicaciones de minería de datos.

La fase del Data Mining nos habla, principalmente, a los medios por los cuales los patrones
se extraen y se enumeran a partir de los datos. Es muy importante recalcar como el
crecimiento de la atención prestada al área surgió del surgimiento de grandes bases de
datos en un número creciente y diferenciado de organizaciones. Existe el riesgo de
desperdiciar todo el valor y la riqueza de la información contenida en estas bases de datos,
a menos que se utilicen las técnicas adecuadas para extraer conocimiento útil, ya que en
la actualidad en la mayoría de las empresas incluso en donde yo laboro se hace uso de
estos conocimientos para extraer información que nos permitan seguir con el negocio
además de tener una panorámica del mercado más amplia.

El conocimiento descubierto en bases de datos (KDD) cuenta con un proceso de selección


que nos permite crear un objetivo a buscar en la base de datos o simplemente enfocarnos
en variables a desarrollar mediante un pre-procesamiento para limpiar la información y
lograr filtrar lo más útil y así poder transformar esta información y poder dimensionarla
para hacer minería de datos, buscando patrones de interés en una representación muy
particular de la información para finalmente interpretar y evaluar con el fin de obtener el
conocimiento deseado, este proceso está muy completo ya que como todo proceso lleva
un orden que nos permitirá de manera correcta analizar los datos y lograr obtener el
resultado deseado o información valiosa para una organización.

Existen demás procesos como SEMMA que significa Muestrear, Explorar, Modificar,
Modificar y Evaluar que es otra serie de pasos en la minería de datos o más bien con el fin
de llegar a una correcta minería de datos y que nos ofrece un fácil entendimiento del
proceso permitiendo a la organización adecuar esta información obtenida a través de la
minería de datos. Y también el proceso CRISP-DM El cual es un proceso estándar de
Minería de datos el cual consta de un ciclo que compromete 6 etapas que entorno a la
información nos permiten llegar a un nivel de conocimiento más alto ya que este proceso
está completamente documentado. Una buena comparación como se lee en el artículo nos
va a permitir el elegir el método más adecuado para el tipo de información con el que
contamos y poder extraer información de valor ya que algunos modelos pueden ser más
explícitos que otros.

Potrebbero piacerti anche