Sei sulla pagina 1di 15

 Curso:

Tecnologías de la Información
 Profesor:
Ing. Rubén Martínez Varela
 Alumno:
Andy Brayan Trujillo Garcia.
 Tema:
Big Data y Machine Learning.
¿Qué es Big Data?
 Big Data es un término que
describe el gran volumen de
datos, tanto estructurados como
no estructurados, que inundan
los negocios cada día. Pero no
es la cantidad de datos lo que
es importante. Lo que importa
con el Big Data es lo que las
organizaciones hacen con los
datos.
¿Cuándo se considera como Big Data?
 Aunque el tamaño utilizado para
determinar si un conjunto de
datos determinado se considera
Big Data no está firmemente
definido y sigue cambiando con
el tiempo, la mayoría de los
analistas y profesionales
actualmente se refieren a
conjuntos de datos que van
desde 30-50 Terabytes a varios
Petabytes.
Historia del Big Data
 Aunque el término “big data” es
relativamente nuevo, la acción de
recopilar y almacenar grandes
cantidades de información para su
posterior análisis se viene
realizando desde hace muchos
años. El concepto cobró impulso a
principios de la década del 2000
cuando el analista de la industria
Doug Laney articuló la definición
ahora muy popular del big data.
¿Por qué es importante el Big Data?
 Lo que hace que Big Data sea tan útil para
muchas empresas es el hecho de que
proporciona respuestas a muchas preguntas
que las empresas ni siquiera sabían que tenían.
La recopilación de grandes cantidades de datos
y la búsqueda de tendencias dentro de los datos
permiten que las empresas se muevan mucho
más rápidamente, sin problemas y de manera
eficiente. También les permite eliminar las áreas
problemáticas antes de que los problemas
acaben con sus beneficios o su reputación.
Tipos de Datos
Los tipos de datos también son muy
amplios:
 Tipos de datos no estructurados:
documentos, vídeos, audios, etc.
 Tipos de datos semi-estructurados:
software, hojas de cálculo,
informes.
 Tipos de datos estructurados.
Desafíos de la calidad de datos en Big Data
 Las especiales
características del Big
Data hacen que su
calidad de datos se
enfrente a múltiples
desafíos. Se trata de las
conocidas como 5 Vs:
Volumen, Velocidad,
Variedad, Veracidad y
Valor, que definen la
problemática del Big
Data.
¿Qué es Machine Learning?

 Machine Learning es una disciplina


científica del ámbito de la
Inteligencia Artificial que crea
sistemas que aprenden
automáticamente. Aprender en este
contexto quiere decir identificar
patrones complejos en millones de
datos. La máquina que realmente
aprende es un algoritmo que revisa
los datos y es capaz de predecir
comportamientos futuros.
¿ Por que es importante el Machine Learning?
 La cantidad de datos que se generan
actualmente en las empresas se está
incrementado de forma exponencial.
Extraer información valiosa de ellos
supone una ventaja competitiva que no
se puede menospreciar. Existen en el
mercado herramientas de uso muy
sencillo y asequibles económicamente
para cualquier tamaño de empresa que
permiten hacer predicciones.
Big Data y Machine Learning aplicado a
la empresa

 Una empresa de
telefonía quiere
saber qué clientes
están en “peligro”
de darse de baja de
sus servicios para
hacer acciones
comerciales que
eviten que se vayan
a la competencia.
La visualización en árbol mostrada en la diapositiva anterior, permite ver
los patrones que han seguido ciertos clientes que se han dado de baja.
En este caso está resaltada una de las ramas centrales, que indican un
patrón en el que el cliente:
 Tiene más de 3 llamadas al servicio de atención al cliente.
 Llama menos de 171,95 minutos al día.
 Las llamadas en horario nocturno son inferiores a 189,02 minutos.
Si los clientes que tienen estas características ya se han dado de baja de
la compañía, es previsible que los que todavía son clientes y tienen este
mismo comportamiento estén en riesgo de irse. Según este modelo
predictivo, es bastante probable que esto suceda (se dice que la
predicción tiene una confianza, en este caso, de 91,97%). Si el
departamento de marketing tuviera esta información, podría proponerles
proactivamente un cambio de plan de tarificación o podría revisar por qué
han llamado al servicio de atención al cliente para intentar mantenerlos.
Ámbitos de aplicación del Machine Learning.
 Detectar fraude en transacciones.
 Predecir de fallos en equipos tecnológicos.
 Prever qué empleados serán más rentables el año que viene.
 Seleccionar clientes potenciales basándose en comportamientos en
las redes sociales, interacciones en la web.
 Decidir cuál es la mejor hora para llamar a un cliente.
 Hacer prediagnósticos médicos basados en síntomas del paciente.
 Hacer prediagnósticos médicos basados en síntomas del paciente.

Potrebbero piacerti anche