Esta toma de decisiones, en el sentido más amplio, está motivada por la mejora del negocio, de un proceso o de un activo de la compañía. Pero no solo nos podemos enfocar en el análisis, ya que hasta llegar a él existen fases previas sin la cuales no podríamos actuar.
El ciclo evolutivo de los datos
Antes de entrar a conocer el itinerario metodológica o ruta que sigue un proceso BIG DATA debemos pararnos a pensar en qué tipo de datos debemos incorporar en el flujo.
Los datos tienen un origen múltiple hoy en día y no siempre su naturaleza tiene la condición de estructurada.
Las fuentes de información DATA son:
1.- Los de Web y Social Media: Incorpora datos de internet y los que proceden de las redes sociales.
2.- Los procedentes de máquinas, dispositivos: Sensores y medidores que nos permiten conocer entre otras: velocidad, temperatura, presión, variables meteorológicas, variables químicas como la salinidad, etc.
3.- Macrodatos transaccionales: Tipo de datos específicos por sectores que tienen carácter mercantil.
4.- Información biométrica: Tipo de información que tiene que ver con datos biológicos. Reconocimiento fácil, huella, etc.
5.- Generados por el hombre: Tipo de información generada por los humanos.
Para que el dato sea útil a una organización, este ha pasado por distintas fases por un proceso, que tiene distintas etapas o escalones y en los que en cada caso se actúa de una manera distinta.
Elección de los datos, ya hemos hablado de los tipos que existen, pero es importante destacar en este punto que lo crítico es precisamente ser “crítico” es decir, discriminar que datos consideramos óptimos para su incorporación en el proceso y cuáles no.
La extracción es el proceso de “activación” de la información mediante distintas técnicas. Cabe destacar aquí el muestreo, como sistema por el cual de un “grupo cierto” de datos y su estudio caracterizamos el 100% de la información.En esta fase o escalón es tan importante como la activación del contenido la preparación de este para sus fases posteriores. Por ejemplo, en fases posteriores sería muy difícil incorporar cierto tipo de datos transaccionales sin su adaptación.
La creación del modelo o modelización se lleva a cabo en la
fase de agregación donde se procede a una segunda criba, llevando a cabo acciones tales como, por ejemplo, la unificación, la limpieza, la reducción o ampliación, la rectificación, la corrección, etc.
En el
procesamiento, es cuando aflora la información a considerar y se definen las reglas por las que el Data está siendo explotado.
Con la
utilización, se consigue que las fases anteriores tengas sentido, se hagan patentes y aparecen los datos.Hay innumerables elementos para ofrecer estos: KPIs, Dashboards, mapas interactivos, diagramas…, pero lo realmente importante es ofrecer técnicas de visualización que hagan que el “decisor” haga caso a su instinto y tome las decisiones pertinentes.
Finalmente, en la
revisión, reconvertimos y evaluamos todo lo anterior para valorar si hay margen de mejora.
La visualización es clave para el entendimiento de esta disciplina. Percibimos mejor las imágenes que cualquier otro estímulo. El ser humano “necesita” simplificación y grafismo para entender y tomar decisiones.
¿Buscas un
máster en Análsiis de Datos y Big Data? has llegado a la escuela que puede ayudarte, con el
máster más reconocido en rankings de este área.