Big Data

¿Qué es Big Data? 



Big data, macrodatos, datos masivos, inteligencia de datos o datos a gran escala es un concepto que hace referencia a conjuntos de datos tan grandes que aplicaciones informáticas tradicionales del procesamiento de datos no son suficientes para tratar con ellos y a los procedimientos usados para encontrar patrones repetitivos dentro de esos datos.



Características del Big Data



Volumen. La cantidad de datos. Mientras que el volumen indica más datos, la naturaleza granular de los datos es única. Los big data requieren procesar altos volúmenes de datos Hadoop no estructurados y de baja densidad; es decir, datos de valor desconocido, como fuentes de datos de Twitter, flujos de clics en una página web y una aplicación móvil, tráfico de red, equipos con sensores que capturan datos a la velocidad de la luz, y mucho más. Es la tarea de los big data convertir estos datos Hadoop en información valiosa. Para algunas organizaciones, puede significar decenas de terabytes; para otras, cientos de petabytes.

Velocidad. El ritmo en que se reciben los datos y, quizás, se ponen en práctica. Normalmente, los datos de velocidad más alta fluyen directamente a la memoria en lugar de escribirse en el disco. Algunas aplicaciones de Internet de las cosas tienen ramificaciones de estado y seguridad que requieren evaluación y acción en tiempo real. Otros productos inteligentes de Internet funcionan en tiempo real o prácticamente en tiempo real. Por ejemplo, las aplicaciones de comercio electrónico para los consumidores buscan combinar la ubicación del dispositivo móvil y las preferencias personales para hacer ofertas de marketing de tiempo limitado. En términos operativos, las experiencias de aplicaciones móviles tienen una mayor cantidad de usuarios, un mayor tráfico de red y la expectativa de respuestas inmediatas.

Variedad. Nuevos tipos de datos no estructurados. Los tipos de datos no estructurados o semiestructurados, como texto, audio y video, requieren un procesamiento adicional para extraer el significado y los metadatos de respaldo. Una vez comprendidos, los datos no estructurados tienen muchos de los mismos requisitos que los datos estructurados, como resumen, linaje, auditabilidad y privacidad. Surgen complejidades adicionales cuando los datos de una fuente conocida cambian sin previo aviso. Los cambios de esquema frecuentes o en tiempo real son una carga enorme para los entornos de transacción y análisis.

Valor. Los datos tienen un valor intrínseco, pero debe ser descubierto. Hay una variedad de técnicas cuantitativas y de investigación para extraer el valor de los datos; desde descubrir una preferencia u opinión del consumidor a realizar una oferta importante por ubicación o identificar una pieza del equipo que está a punto de fallar. El avance tecnológico es que el costo del cálculo y del almacenamiento de datos ha disminuido considerablemente, lo que proporciona una infinidad de datos desde los cuales se lleva a cabo una comparación entre el análisis estadístico de todos los datos con las muestras anteriores. El avance tecnológico hace que sea posible tomar decisiones mucho más precisas y adecuadas. Sin embargo, encontrar el valor también requiere nuevos procesos de descubrimiento que involucran a analistas, usuarios empresariales y ejecutivos inteligentes y perspicaces. El desafío real de los big data es humano y tiene que ver con aprender a hacer las preguntas correctas, reconocer patrones, formular hipótesis informadas y predecir comportamientos.


Tipos de datos en Big Data


Para aclarar qué es lo que se recoge para el análisis, podemos dividirlos en dos grandes categorías:

  • Datos estructurados. Aquellos que tienen longitud y formato (por ejemplo fechas) y que pueden ser almacenados en tablas (como las bases de datos relacionales). En esta categoría entran los que se compilan en los censos de población, los diferentes tipos de encuestas, los datos de transacciones bancarias, las compras en tiendas online, etc.
  • Datos no estructurados. Son los que carecen de un formato determinado y no pueden ser almacenados en una tabla. Pueden ser de tipo texto (los que generan los usuarios de foros, redes sociales, documentos de Word), y los de tipo no-texto (cualquier fichero de imagen, audio, vídeo). Dentro de esta categoría, podemos añadir los Datos semiestructurados, que son los que no pertenecen a bases de datos relacionales ya que no se limitan a campos determinados, aunque poseen organización interna o marcadores que facilita el tratamiento de sus elementos; estaríamos hablando de documentos XML, HTML o los datos almacenados en bases de datos NoSQL.



Utilidades del Big Data


1. Real – time marketing y native advertising

El uso del Big Data abre las puertas a una personalización más fina de los anuncios de Display que nos encontramos en casi todas las páginas en las cuales navegamos.
Más volumen de datos permite tener en cuenta el comportamiento global de un internauta que se basa únicamente en la navegación en un único sitio web.

2. Información y user experience (UX) personalizadas- Google, Facebook y Amazon lideran esta carrera

Gracias al Big Data estos gigantes de Internet ofrecen a cada uno de sus usuarios una experiencia única cuando entra en sus páginas.
La información que verá Pepe Perez de Granada en Amazon será totalmente diferente de la que tendrá Gonzalo Martinez en Madrid navegando en la misma página: experiencia diferente, recomendaciones personalizadas según la información recaudada previamente sobre cada uno.

3. El Marketing Automation o la automatización del marketing

El Marketing Automation utiliza la tecnología para gestionar y automatizar la relación con un potencial cliente a lo largo de su buyer journey (proceso de compra) desde la captación hasta la compra final.
El objetivo de la automatización del marketing es de no perder ninguna oportunidad de venta y mejorar así la conversión.

4. Análisis predictivo

Hoy en día, pocas son las empresas que analizan los flujos de datos externos. Se concentran sobre todo en el análisis de los flujos proviniendo de sus propios canales de interacción con sus consumidores: página web, canal Youtube, newsletter etc…
Hasta hace poco, el reporting se hacía canal por canal. Por falta de unificación, las empresas tenían entonces varias visiones limitadas segmentadas por canal de comunicación.
Captando ahora varios flujos de datos y cruzándolos entre ellos para analizarlos, llegamos a una visión mucho más amplia del consumidor. Esta visión permite adaptar mejor las acciones de marketing operacional y definir escenarios de marketing automatizado adaptado a cada segmento definido.
El objetivo al final es llegar a un análisis predictivo del comportamiento del consumidor que permitirá anticipar las necesidades del cliente y enviarle la información o propuesta correcta en el momento que lo necesita.


Conclusión


Como vemos actualmente el Internet basa muchos de sus contenidos en el análisis del Big Data generado por los usuarios, se observa un gran avance en la rama del Machine Learning, el Internet es cada vez más personalizado y basa sus recomendaciones en toda la actividad que tu realizas.
Actualmente la utilidad se ve más en la generación de un interés enel usuario por visitar ciertos sitios, pero se espera en un futuro poder analizar este tipo de datos y aplicarlos a ramas como la medicina.


Referencias

  • Ricardo Barranco Fragoso. (2012). ¿Qué es Big Data?. 14 de mayo de 2017, de IBM developerworks Sitio web: https://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/
  • Oracle. (2015). ¿Qué son los big data?. 14 de mayo de 2017, de Oracle Sitio web: https://www.oracle.com/lad/big-data/index.html
  • Stephanie Ollive y Juan Carlos Acero Linares. (2015). El Big Data: ¿Qué es y para qué sirve?. 14 de mayo de 2017, de CoREGISTROS Sitio web: https://www.coregistros.com/2016/07/07/el-big-data-que-es-y-para-que-sirve/
  • Miguel Ángel Lucas. (2015). Big Data, significado y su utilidad en la sociedad. 14 de mayo de 2017, de MiBloguel Sitio web: https://mibloguel.com/big-data-significado-y-su-utilidad-en-la-sociedad/

Comentarios

Entradas populares