Soluciones Claro

Por dónde empiezo mi estrategia de Big Data

Informacion sobre big data

Muchas personas y empresas sentimos la presión de empezar a utilizar la tecnología de Big Data, inteligencia artificial y la analítica para mejorar nuestros resultados. Esto resulta ser tan complicado que podemos perdernos o desmotivarnos. Nos gustaría tener un manual sencillo de cómo empezar, pero este no existe. Como consecuencia se empiezan a tomar medidas que no necesariamente son las correctas.

Una de las mayores dificultades es toda la bibliografía que existe sobre el tema, todas las tecnologías asociadas a estos términos y la poca experiencia que existe. Adicionalmente, las pocas historias o casos de éxito que no nos permiten copiar del éxito de los demás, al menos en la región centroamericana.

No soy dueño de la verdad, pero me he dedicado a estudiar sobre el tema y mi experiencia dando consultorías me lleva recomendar lo siguiente:

  1. Lo primero que debemos preguntarnos es cómo están los datos en nuestra empresa.   En esta fase no se trata de ir a explorar la calidad de la data, sino en examinar cuales son las principales fuentes de información que tenemos.  Dentro de los ejemplos más comunes son los ERPs, los CRMs o cualquier herramienta que utilicemos en nuestro punto de ventas. Antes de empezar a explotar data tenemos que generarla. Esto no significa que volvamos una tienda electrónica nuestra empresa, significa que debemos de entender cuáles son los sistemas actuales que tenemos.
  2. Luego de tener identificados los principales sistemas, debemos entender cuáles son los problemas o dolores que tenemos actualmente para poder resolver eventualmente con datos. Algunas empresas, incluyendo las grandes corporaciones, omiten este paso y van directo a crear una nueva unidad de “Data Science”.  Sin tener claro los problemas que querremos resolver los resultados de este nuevo equipo serán mínimos.
  3. Una vez que se tienen identificados algunos de los problemas más importantes ya se puede evaluar si se contrata o si se puede tercerizar el tema de Data Science. La inversión en un servidor en la nube debe de ir alineada a la data que se requerirá para resolver estos problemas iniciales.  Es un error hacer una data lake con información que no sabes si algún día se va a utilizar.  En este paso lo relevante es crear una data lake con la data necesaria y tomar la decisión de si contratar o tercerizar a los científicos de datos.  Mi sugerencia siempre será empezar con expertos. El formar científicos de datos puede salir muy caro, sobre todo por lo que tardaran en aprender y el aplazamiento de los resultados.
  4. Ya que tenemos resueltas todas las incógnitas del punto 3 entonces ya podemos entrar a analizar la calidad de la data que se tiene y empezar con el proceso interno de Data Governance.   Esta parte bien puede ser ejecutada por el departamento de IT, esto no sugiero tercerizarlo. En este proceso es donde empezaremos a ver la calidad de la data recolectada. Se puede realizar un análisis de exploración de datos para determinar si los campos vienen completos. Este EDA (Exploratory Data Analysis por sus siglas en inglés) es crítico para validar cada una de las fuentes de información.  Otro proceso muy importante en el Data Governance es el monitoreo de meta datos. Por ejemplo, si debemos de recibir cada hpra información de ventas, eso implica que diariamente debemos de recibir 10 o 12 archivos, uno por cada hora en la que estemos abiertos.   Por último, debemos de ver quienes tienen acceso a la información, recordemos que el 70% de los robos de información se dan por fugas internas.
  5. Ya que sabemos con qué información podemos contar entonces ya podemos revisar nuevamente nuestros problemas e irlos priorizando.  Un error muy común es querer resolver muchos problemas a la vez, todos queremos aprovechar el juguete nuevo, pero todo debe de tener un orden. Recomiendo empezar por los proyectos más cortos que tengan un mayor alcance, los famosos “quick hits”. Esto ayudara a generar esa credibilidad en la cultura de la nueva empresa.
  6. Algo que rápidamente olvidan los científicos de datos es que el usuario final de la data. Quien va a tomar decisiones, NO ES un científico de datos, si no le entregamos algo que sea fácilmente utilizado por ellos será muy complicado que lo utilicen y terminaran engavetándolo.  Para esto existen herramientas de visualización que nos ayudan a que el usuario final pueda entender fácilmente los resultados del análisis realizado. Entre estas herramientas se encuentra Tableau o Power BI.
  7. La última fase es tan crítica como las primeras 6. Si no hacemos que el proceso que antes tomaba decisiones basado en mi “experiencia” empiece a utilizar los datos para tomar decisiones, de nada habrá servido todo el trabajo realizado, y esto suele ser el paso más difícil.  Peter Drucker decía que la cultura se come a la estrategia de desayuno. La resistencia al cambio ante estas nuevas tecnologías es muy grande, porque hacen creer a las personas que realizaban estas tareas que serían reemplazadas por máquinas y que pueden perder su trabajo.

En resumen, estos son los pasos que recomiendo para iniciar la aventura de la explotación de los datos y el uso de modelos de inteligencia artificial en las empresas, puede ser que algunas encuentren atajos y les funcionen, pero mi experiencia me dice que en algún momento tendrán que llegar a hacer los 7 pasos para tener un departamento solido de Data Science

Por Juan José Dougherty – Innovation Lab leader Claro Empresas Centroamérica

Acerca de Claro Empresas

¿Qué tan útil te resultó la información?

Haz clic para dar tu calificación

Puntuación promedio 1 / 5. Conteo: 2

Sé el primero en calificar.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *