¿Qué es Big Data?

¿Qué es Big Data?

Big Data es un término que se ha puesto muy de moda en los últimos años pero aún mucha gente se confunde con el concepto.

¿Acaso no se recolectan, almacenan y analizan datos desde hace décadas? ¿Estamos hablando simplemente de un problema de tamaño?, ¿Es el big data, lo mismo que el Business Intelligence y analítica de datos pero con mucho más volúmen de información? , ¿Por qué se habla de revolución?

Para aclarar el panorama, empecemos hablando de la cantidad de información disponible en la actualidad. La cantidad de datos generados hoy en día no tienen comparación alguna con épocas anteriores. Y si esto no le queda claro, seguramente necesita expandir su definición de datos. Se consideran datos, las interacciones en redes sociales, los videos de YouTube, los twitters, los comentarios en blog, las interacciones de un usuario con una página de internet, los datos generados por máquinas a través de sensores, las fotos y por supuesto todos los datos “tradicionales” como información financiera, de ventas, de productos, etc.

Como sociedad generamos y guardamos más información que en cualquier otra época. La información crece de forma exponencial y basta con decir que más del 90% de la información existente en el mundo fue creada en los últimos 5 años. Sin embargo, todo este diluvio de datos  no se puede organizar o interpretar fácilmente por la tecnología tradicional. Esta nueva información es intensa en textos y no tiene una estructura definida, lo que dificulta su almacenamiento y análisis a través de bases de datos tradicionales.

No hace mucho el almacenamiento de  datos en abundancia era sumamente costoso y el análisis de los mismos requería modelos muy sofisticados. Las empresas optaban por almacenar aquellos datos que claramente podían identificar, “estructurar” y analizar y dejaban de lado todo aquello que no era útil en ese momento. Muchas empresas simplemente descartaban información que consideraban secundaria para obtener el preciado espacio en disco.  En los últimos años,  el costo de almacenaje se ha desplomando y la velocidad de red y su confiabilidad han aumentado considerablemente, haciendo que  la acumulación de datos para una empresa ya no sea tan costoso.

Entonces, volviendo a la definición del Big Data, la consultora Gartner acuñó el término “3 Vs” para definirla y este término se ha popularizado en el mundo para hablar de Big Data. Un set de datos debe compartir las siguientes 3 características para considerarse Big Data:

  • Volumen- Extrema cantidad de datos
  • Velocidad- Extrema velocidad de generación de información
  • Variedad- Datos estructurados, no estructurados, proveniente de humanos, máquinas o la interacción de los mismos.

El Big Data no es una tecnología aislada y no se generó recientemente. Es una combinación de tecnologías nuevas y no tan nuevas. Es la intersección entre la ciencia de la computación, la estadística y métodos de visualización que se vieron enormemente potenciados cuando los gigantes tecnológicos Google y Yahoo entendieron que podían generar oportunidades de negocio a través de los datos que almacenaban,  y empezaron a desarrollar las soluciones tecnológicas que hoy en día son la base para la manipulación y análisis de ese volumen extremo de datos.

En resumen, estamos ante una complejidad enorme de datos, tenemos aquellos estructurados y guardados en las bases de datos tradicionales, otros no estructurados y generados por agentes externos a la propia empresa, así como nueva infromación generado por canales anteriormente inexistentes como ser sensores y máquinas. Sin embargo, todos ellos comparten la misma característica de que  llegan a una velocidad vertiginosa.

Cada vez que hacemos una búsqueda en Google, compartimos nuestro estado en Facebook, hacemos una compra en Internet o  leemos las noticias  dejamos un rastro enorme de información que es valiosísima para aquellas empresas que tratan de entendernos como consumidores y tratan de vendernos sus productos o crear nuevos productos en base a nuestro comportamiento.

Entonces la respuesta a la pregunta ¿Es el Big Data simplemente una cuestión de tamaño? No, claro que no, es una nueva forma de pensar que está abriendo la puerta a innumerables oportunidades de negocio y a una decena de profesiones inexistentes hace más de una década. El Big data es Netflix sabiendo exactamente cuál es el número mágico de películas que debe mostrarle en el proceso de registro para asegurarlo como un cliente de largo plazo. Es Walmart, monitoreando las redes sociales y cruzando esa información con el sistema de inventario para saber exactamente cuáles son los eventos deportivos cercanos y cómo llenar las góndolas con material alusivo al encuentro.  Es Google haciendo uso de su información respecto a nuestras búsquedas y pudiendo saber antes que la propia Organización Mundial de la Salud cómo se disipa la gripe A por el mundo.

En los siguientes post, hablaremos de la inmensa cantidad de oportunidades para empresas y profesionales en este nuevo rubro y  casos de estudio de empresas que han obtenido enormes ventajas competitivas orientándose al análisis de estos datos.

2 thoughts on “¿Qué es Big Data?

  1. Mallesh

    Me gustaría aprender la tecnología de Hadoop -Big data.
    Los post son muy interesantes en este enlace. Me apoyan mucho para mejorar los conocimientos de Data science.
    Espero que sea un gran éxito.

    Saludos !!!

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *