Data Analytics requires a new mindset

El análisis de datos requiere una nueva mentalidad. Así es como se puede lograr.

El factor de éxito principal para cualquier proyecto de datos es la voluntad política sostenible.

La infraestructura, las habilidades y los procesos que se requieren para analizar los datos son muy diferentes de aquellos que se necesitan para tan solo recopilarlos y organizarlos. Esto es lo que los líderes de la TI empresarial necesitan saber para sentar las bases para tomar decisiones basadas en datos.

Las empresas tienen una enorme cantidad de datos. A gran parte de estos se los conoce como datos transaccionales, que consumen las aplicaciones, como las aplicaciones web, las ERP o los sistemas CRM. Su recopilación ayuda a automatizar los procesos diarios y hacerlos más rastreables o auditables. Ayudan a las empresas a captar ventas incrementales o a hacer mejoras adicionales en sus sistemas. Además, ayudan a preservar el registro histórico de las acciones y los servicios que se prestan.

Pero a medida que el volumen de estos datos transaccionales ha ido creciendo hasta alcanzar enormes proporciones, muchas empresas se han dado cuenta de que esta gran cantidad de datos también contiene información sobre tendencias y patrones que pueden guiar la toma de decisiones y la innovación. Claro, siempre y cuando dichas empresas puedan hacer dos cosas: asegurarse de que la información sea de buena calidad y de que sea posible llevarla al lugar correcto para realizar un análisis más detallado.

Para hacerlo, debemos pasar de una mentalidad de recopilación y organización de datos transaccionales (un área en la que la mayoría de las empresas que encuentro ya son expertas) a una mentalidad analítica. En el proceso, debemos asegurarnos de que quienes utilizan los datos confíen y se sientan cómodos al basar sus decisiones en ellos.

Este recorrido puede ser complejo. Las habilidades, los procesos y las infraestructuras que se relacionan con el análisis de datos son muy diferentes de los que se relacionan con la recopilación y organización de los datos. Y la arquitectura suele necesitar un desarrollo específico.

Por lo tanto, si la suya es una de esas empresas que sabe que podría estar aprovechando mejor sus datos, antes de comenzar a hacerlo, veamos algunas de las decisiones que necesitará tomar en su recorrido para transformarse en una empresa basada en datos.

Decisión 1: Identificar sus datos

Lo primero que hay que hacer es identificar los datos que tiene en la actualidad.

Esto no es tan obvio como suena. Se trata de entender no solo qué son estos datos, sino también dónde están y cómo puede acceder a ellos con mayor facilidad. Además, necesita comprender su procedencia: ¿cómo llegaron allí, y qué decisiones y procesos podrían haber afectado su calidad?

La calidad puede representar un desafío especial para los sistemas transaccionales debido a que los errores humanos, los atajos y las omisiones en el punto de entrada pueden acumularse a lo largo de los años y llegar a tener impactos significativos. Y a medida que los lagos de datos desarrollados por diferentes equipos se agregan a estos flujos transaccionales, sus suposiciones con respecto a las intenciones de los desarrolladores originales también pueden presentar problemas de calidad.

También debe comprender si es posible o no ejecutar su análisis en el sistema en el que se aloja actualmente. En general, no se puede, o no se debe, debido a los riesgos que supone para las operaciones diarias ejecutar estos cálculos en sistemas de bases de datos que prestan servicios a aplicaciones frontend.

Por lo tanto, algunas de las primeras decisiones que tome se basarán en las respuestas a estas dos preguntas: ¿Dónde necesita o quiere que se alojen esos datos? ¿Y cuáles son los factores operativos y las condiciones regulatorias que podrían influir en ello?

Decisión 2: Identificar la oportunidad

Es probable que las empresas tengan al menos una docena de casos de uso en los que sospechen que sus datos podrían aprovecharse mejor. Pero hacerlo tiene un costo demasiado elevado y, desde el punto de vista organizativo, es muy difícil asumir demasiados proyectos a la vez.

Identificar el caso de uso más alcanzable que tenga el mayor impacto es una decisión inicial importante. Las preguntas clave que se deben hacer incluyen: ¿Cómo luce para usted el resultado final deseado? ¿Se trata de mejorar los dashboards y las visualizaciones, de automatizar la generación de informes para las finanzas de fin de mes o de aprovechar el análisis predictivo para apoyar la toma de decisiones de los directivos y ejecutivos?

Cualquiera sea su caso de uso específico, es probable que se encuentre en una de las tres categorías generales con un perfil de usuario asociado, lo que también influirá en algunas de las decisiones que tome más adelante con respecto a la infraestructura. Estas categorías son:

  1. Inteligencia de negocios/visualización: Este caso de uso se centra en permitir una generación de informes y una toma de decisiones mejoradas, y los usuarios tenderán a ser no técnicos. No van a desarrollar características en el lago de datos ni sumar nada a su infraestructura de TI.
  2. Automatización y machine learning: En este caso de uso, es posible que usted ya tenga sus datos operativos y de informes en alguna parte, pero quiere que estén disponibles para los procesos de machine learning a fin de impulsar información prescriptiva y predictiva. Eso requiere poner rápidamente a disposición de los científicos de datos conjuntos de datos grandes, históricos y, a menudo, muy específicos.
  3. Alimentación de otros sistemas transaccionales: Este caso de uso final se centra en poner los datos del sistema A a disposición del sistema B para impulsar procesos y resultados de negocio adicionales. Un sistema como este será el de empaquetar y preparar pequeños fragmentos de datos del lago de datos, y compartirlos con el sistema de destino.

Decisión 3: Identificar las necesidades de infraestructura actuales y futuras

El caso de uso que está tratando de resolver influirá en sus decisiones tecnológicas inmediatas en torno al acceso a los datos desde su lago de datos y al desarrollo de los flujos para hacer llegar esos datos a los sistemas y usuarios correspondientes.

Pero cuando se toman esas decisiones en torno a la infraestructura, es importante tener en cuenta la necesidad de adaptabilidad. Es muy probable que en el futuro desee satisfacer uno de los otros casos de uso. Las organizaciones que empiezan a ver ganancias con el análisis de datos tienden a desarrollar rápidamente un gran deseo por más aplicaciones que, a la vez, son más extensas. Por ejemplo, ayudamos a un cliente de la industria de petróleo y gas a tomar datos de un sistema de proyección financiera existente y a ponerlos a disposición de una audiencia más amplia a través de su lago de datos. El éxito de ese caso de uso pronto provocó que quisieran tomar esos mismos datos y ponerlos en un sistema específico de creación de modelos financieros para la planificación ejecutiva.

Por lo tanto, su próxima decisión clave es si debe desarrollar una infraestructura en torno a su lago de datos que se utilice solo para su sistema o caso de uso específico (lo cual es poco probable) o si debe desarrollar una base que también incluya los futuros casos de uso. Las primeras preguntas clave que se deben plantear para establecer esta mentalidad de adaptabilidad incluyen: ¿Pueden estos mismos datos también ayudar a desarrollar modelos predictivos o a impulsar la automatización en otras áreas del negocio? Si es así, ¿cuáles son los sistemas adicionales que se deben tener en cuenta?

En última instancia, lo que decida desarrollar se basará en las sutilezas de lo que desea lograr ahora y en sus mejores esfuerzos para anticipar el uso de esos datos en el futuro.

Errores comunes que se deben evitar

Entre los errores más comunes que se deben evitar se encuentra el de garantizar que sus datos sean de buena calidad y que tengan un caso de uso claro antes de comenzar a desarrollar sus flujos de datos. Además, asegúrese de que cuando se desarrollen esos flujos, estén incorporados de acuerdo con las mejores prácticas de la ingeniería de software.

Es difícil evaluar la calidad de los datos ya que esta puede ser una medida subjetiva, pero el punto de referencia mínimo es que los usuarios puedan confiar en ellos lo suficiente como para tomar decisiones basadas en la información que generan de forma segura. Mientras tanto, transmitir las mejores prácticas de la ingeniería de software se hace cada vez más urgente a medida que las disciplinas de analista y programador de datos comienzan a converger. Por ejemplo, muy a menudo los analistas devenidos en programadores pasan por alto los procesos básicos de CI/CD, ejecutan el código en los sistemas de producción a mano o desarrollan sus proyectos de manera que son difíciles de mantener y hacer evolucionar.

Pero la regla de oro, que me presentó uno de nuestros directores de cuenta estratégicos, es la siguiente: El factor de éxito principal para cualquier proyecto de datos es la voluntad política sostenible.

El factor de éxito principal para cualquier proyecto de datos es la voluntad política sostenible.

Estos son proyectos a largo plazo. Para generar y sostener la voluntad política que se requiere a largo plazo, necesita demostrar valor a sus usuarios con rapidez y mantener la participación de un miembro del equipo directivo que esté dispuesto a hacer que la inversión funcione.

 

Join the Conversation: Find Solve on Twitter and LinkedIn, or follow along via RSS.

Stay on top of what's next in technology

Learn about tech trends, innovations and how technologists are working today.

Subscribe
Data Bodies of Water

Una guía de campo para los cuerpos de agua de datos

About the Authors

Traey Hatch

Practice Manager - Big Data

Traey Hatch

Read more about Traey Hatch