Sei sulla pagina 1di 1

Introducción

estructurados (bases de datos) y no estructurados, datos jerárquicos, documen-


tos, correo electrónico, datos de medición, vídeo, imágenes fijas, audio, datos
de cotizaciones, transacciones financieras, etc., entre otras clases de fuentes
generadoras de diferentes tipos de información.
Sin embargo, algunas organizaciones incluyen una cuarta V, ya sea para referirse a la
veracidad de los datos, cuya valía exacta es vital para el negocio, o para referirse al
valor de la información que proporcionan estos análisis:
• Veracidad. Big data ha de ser capaz de tratar y analizar inteligentemente este
gran volumen de datos con la finalidad de obtener una información verídica y útil
que nos permita mejorar la toma de decisiones basada en los datos más exactos.
• Valor. Hace referencia a los beneficios que se desprenden del uso de big data
(reducción de costes, eficiencia operativa, mejoras de negocio).
Por tanto, se define a la tecnología big data como el conjunto de arquitecturas y herra-
mientas informáticas destinadas a la manipulación, gestión y análisis de grandes volú-
menes de datos desde todo tipo de fuentes, diseñadas para extraer valor y beneficio de
los mismos, con una amplia variedad en su naturaleza, mediante procesos que permitan
capturar, descubrir y analizar información a alta velocidad y con un coste reducido.
Comparativamente, estas nuevas tecnologías de big data no pueden ser equiparadas
con las herramientas informáticas tradicionales. Actualmente las arquitecturas clásicas
de tratamiento de datos no soportan el procesamiento de grandes cantidades de datos
a costes asequibles para la mayoría de las empresas.
Por consiguiente, el objetivo fundamental de big data es dotar de una infraestructura
tecnológica a las empresas y organizaciones con la finalidad de poder almacenar, tra-
tar y analizar de manera económica, rápida y flexible la gran cantidad de datos que se
generan diariamente, para ello es necesario el desarrollo y la implantación tanto de
hardware como de software específicos que gestionen esta explosión de datos con el
fin de extraer valor y así obtener información útil para el negocio. La tecnología big
data tiene por objetivo esta gestión de los datos e información de manera inteligente
que ayude a una correcta toma de decisión.
En el auge de esta era tecnológica, el sistema más utilizado en la industria para ofrecer
capacidades analíticas avanzadas ha sido Hadoop, un software de código abierto cuyo
desarrollo lo coordina la organización Apache Foundation. Hadoop es un framework de
software que soporta aplicaciones distribuidas y facilita el almacenamiento y procesado
de la información. Hadoop y su ecosistema han permitido el procesamiento de grandes
cantidades de datos de manera asequible. Pero todavía no es una tecnología que se
encuentre al alcance de cualquier empresa. La razón de esto es que las tecnologías big
data todavía están en fase de evolución y maduración.

15
E-Books & Papers for Statisticians

Potrebbero piacerti anche