Big Data, ¿qué es y para qué sirve?

Big Data, ¿qué es y para qué sirve?

Cuando hablamos de Big Data, nos referimos a un gran volumen de datos que pueden ser estructurados o no estructurados, procesados con softwares automatizados que permiten su uso para análisis, crear estadísticas, realizar pronósticos y tomar decisiones. 

El término Big Data fue acuñado por el editor de Nature, Clifford Lynch, en un número especial de 2008. Habló sobre el crecimiento explosivo de la información en el mundo. Lynch se refirió a Big Data como cualquier matriz de datos heterogéneos de más de 150 GB por día, pero todavía no existe un criterio único.

Desde 2014, las principales universidades del mundo le han puesto atención al Big Data, donde se imparten especialidades de ingeniería aplicada y Tecnología de la Información (TI). Luego, corporaciones de TI como Microsoft, IBM, Oracle, EMC y luego Google, Apple, Facebook y Amazon se unieron a la recopilación y el análisis. Hoy en día, grandes empresas de todos los sectores utilizan Big Data, así como agencias gubernamentales.

¿Cómo funciona Big Data? ¿Cómo se recopilan y almacenan los grandes datos?

Se necesita Big Data para analizar todos los factores relevantes y tomar la decisión correcta. Con la ayuda de Big Data, los modelos de simulación se construyen para probar una solución, idea o producto en particular.

Las principales fuentes de Big Data:

    • Internet de las cosas (IoT) y dispositivos conectados a él.
    • Redes sociales, blogs y medios de comunicación.
    • Datos de la empresa: transacciones, pedidos de bienes y servicios, viajes en taxi y coche compartido, perfiles de clientes.
    • Lecturas de instrumentos: estaciones meteorológicas, medidores de composición de aire y agua, datos satelitales.
    • Estadísticas de ciudades y estados: datos sobre movimientos, nacimientos y defunciones.
    • Datos médicos: pruebas, enfermedades, imágenes diagnósticas. 

Big Data

Los sistemas informáticos modernos brindan acceso instantáneo a grandes conjuntos de datos. Para su almacenamiento se utilizan centros de datos especiales con los servidores más potentes.
Además de los servidores físicos tradicionales, utilizan almacenamiento en la nube, “lagos de datos” (lago de datos: almacenamiento de una gran cantidad de datos no estructurados de una sola fuente) y Hadoop, un marco que consiste en un conjunto de utilidades para desarrollar y ejecutar aplicaciones distribuidas. Programas de cómputo. Para trabajar con Big Data se utilizan métodos avanzados de integración y gestión, así como preparación de datos para analítica.

Características del Big Data:

Volumen: los datos se miden por la cantidad física y el espacio ocupado en un medio digital. “Grande” se refiere a arreglos de más de 150 GB por día.

Velocidad, actualización: la información se actualiza regularmente y el procesamiento en tiempo real requiere tecnologías inteligentes de Big Data.

Variedad: la información en matrices puede tener formatos heterogéneos, estar estructurada de forma parcial, completa y acumularse de forma no sistemática. Por ejemplo, las redes sociales usan Big Data en forma de textos, videos, audio, transacciones financieras, imágenes y más.

En los sistemas modernos, se consideran dos factores adicionales:

Variabilidad: los flujos de datos pueden tener picos y valles, estacionalidad y periodicidad. Las ráfagas de información no estructurada son difíciles de gestionar y requieren potentes tecnologías de procesamiento.

Valor de los datos (Valor): la información puede tener una complejidad diferente para la percepción y el procesamiento, lo que dificulta el funcionamiento de los sistemas inteligentes. Por ejemplo, una matriz de mensajes de redes sociales es un nivel de datos y las operaciones transaccionales son otro. La tarea de las máquinas es determinar el grado de importancia de la información entrante para estructurarla rápidamente.

Big Data en el marketing 

El uso de Big Data tiene la fortaleza de ofrecer una perspectiva más amplia sobre las posibilidades que puede tener un producto en un mercado. Empresas como Netflix usan esta tecnología para predecir cuáles son las tendencias entre sus consumidores, y tener una idea de cuáles contenidos serán más exitosos en su plataforma. 

En otras palabras, el uso de Big Data puede ser beneficioso al momento de establecer objetivos SMART.

Algunos problemas de la Big Data

Como toda tecnología, la Big Data tiene limitaciones y problemas que necesita resolver para poder funcionar con todo su potencial, y generar confianza:

  • Los datos son heterogéneos y, por lo tanto, difíciles de procesar para la inferencia estadística. Cuantos más parámetros se requieren para el pronóstico, más errores se acumulan en el análisis.
  • Trabajar con grandes cantidades de datos en línea requiere una gran potencia informática. Dichos recursos son muy costosos y, hasta ahora, solo están disponibles para las grandes corporaciones.
  • El almacenamiento y procesamiento de Big Data está asociado a una mayor vulnerabilidad ante ciberataques y todo tipo de filtraciones. Un buen ejemplo son los escándalos relacionados a la privacidad de los usuarios de Facebook.
  • La recopilación de grandes datos a menudo se asocia con un problema de privacidad: no todos quieren que todas sus acciones sean rastreadas y transferidas a terceros.
  • Los grandes datos son utilizados para sus propios fines no solo por las corporaciones, sino también por los políticos: por ejemplo, para influir en las elecciones.

Ante todo esto, la Big Data todavía es una herramienta de gran valor para todo tipo de empresas. Pero sus problemas, tanto en limitaciones tecnológicas, como en lo que se refiere a la confianza de los usuarios, no pueden quedar de lado como consideraciones técnicas y éticas sobre su uso. 

 

Master en big data

Valora este artículo del blog:
¿Qué es la educación por competencias?
¿Qué es la inteligencia artificial?
 

Comentarios

No hay comentarios por el momento. Se el primero en enviar un comentario.
Invitado
Sábado, 13 Agosto 2022