El camino hacia los datos confiables
Si las partes interesadas no pueden confiar en los datos para tomar decisiones importantes, ¿qué sentido tiene recopilarlos, almacenarlos y protegerlos?
Colaboradores: Eduardo Coccaro, Jared Jacobson
Los datos son un motor. Pueden impulsar la eficiencia de las aplicaciones, generar la percepción de los consumidores, potenciar las decisiones comerciales y acelerar la innovación de los productos. Si se administran de forma adecuada, los datos son la base de los esfuerzos exitosos de automatización, aprendizaje automático e inteligencia artificial (AI). Ocho de cada diez ejecutivos encuestados consideran que luchan con su competencia para extraer valor de los datos. Como director ejecutivo de datos (CDO), soy uno de ellos.
Si bien los datos pueden tener un gran potencial, también pueden convertirse en su archienemigo. Los almacenes de datos no estructurados, aislados y mal administrados, sin una estrategia unificada, no tienen valor y, además, son tóxicos. Se podría decir que el efecto secundario más grave de tener datos sin depurar es el factor de confianza, o carecer de él. Si mis partes interesadas no pueden confiar en los datos para tomar decisiones importantes, ¿qué sentido tiene recopilarlos, almacenarlos y protegerlos?
El impacto de los datos sin depurar
Los datos sin depurar pueden llevar a tomar malas decisiones, a costosos errores de cálculo y a impactos negativos en cualquier proyecto basado en datos. Un tercio de los profesionales en TI indica que la mala calidad de los datos es el motivo principal por el que muchos proyectos de AI y de aprendizaje automático tardan más que lo planeado, tienen un costo más alto que el esperado y no brindan resultados útiles.
Cuando las empresas comienzan a sacar provecho de los datos internos, la mayoría descubre que sus datos no están tan limpios ni son tan confiables como esperaban. Centrarse solo en cómo explotar los datos existentes pasa por alto el trabajo previo necesario para recopilar y mantener datos limpios. En el pasado, he visto a las empresas apostar todo a la recopilación de datos y esperar una ganancia analítica rápida. Pero cuando "entra basura, sale basura", y las empresas se decepcionan con la calidad de la información que se genera, ya que, al inicio de la gestión y la recopilación de datos, no se puso atención en la calidad.
Gartner informa que los datos sin depurar desperdician aproximadamente $ 15 millones por año. Ese desperdicio incluye los recursos (servidores, aplicaciones y experiencia) dedicados a mantener los datos que ni siquiera pueden usarse. Yo puedo tener muchos TB de datos a mi disposición, pero eso no significa que sean los datos adecuados para conseguir la información correcta para mi negocio.
A esto se le suma el ataque de las nuevas fuentes de datos, sus tipos y riesgos. La mayoría de los puntos de datos que están en los servidores actualmente se creó en los últimos cinco años a partir del acceso en constante expansión que tenemos a los datos de las redes sociales, la información de los consumidores, los dispositivos móviles y los sensores de IoT. No solo hay más datos, sino que también llegan más rápido con la ayuda de tecnologías de informática de vanguardia y 5G. Almacenar y proteger esta cantidad masiva de datos, en donde solo un porcentaje es realmente valioso, puede costar mucho dinero y lo pone a usted en la mira de los reguladores del cumplimiento de normas por el mal manejo de datos o lo convierte en víctima de los expertos piratas informáticos.
¿Que son los datos confiables?
Mi trabajo como director ejecutivo de datos se volvió más frecuente en la industria por todos los motivos anteriores. Asignar un líder para que posea y controle todos los datos dentro de una empresa es fundamental para crear datos precisos en los que se pueda confiar.
La mayoría de las empresas no sabe por dónde empezar a la hora de seleccionar los datos acumulados. Los desafíos comunes se centran en la identificación y limpieza de datos de alto impacto y en hacer que las partes interesadas confíen en esos datos. Mi meta como CDO es garantizar que todos los datos de mi organización cumplan con los siguientes criterios:
- Los datos deben estar seguros
- Los datos deben estar definidos
- Los datos deben cumplir con las normas de calidad
Las definiciones de cada criterio variarán entre las organizaciones. Yo uso estas definiciones generales para cumplir con esos objetivos:
Seguridad
Los datos seguros se protegen mediante codificación y otras medidas de seguridad. Además, deben cumplir con las normas de privacidad, de cumplimiento y con otras normativas específicas de la industria.
Definición
Si bien crear definiciones corporativas comunes y estándares para los puntos de datos es difícil, es un elemento clave para establecer confianza. Debe haber consonancia a nivel interno con la terminología para que haya un consenso sobre qué métricas analizar y la definición en torno a ellas. Es posible que tenga múltiples definiciones del mismo tipo o fuente para una métrica, pero debe definirla de otro modo para garantizar claridad.
Calidad
El elemento más variable de los datos confiables es la calidad. Un vendedor puede estar conforme con una precisión del 95 % con respecto al tráfico de la tienda, pero es posible que un centro médico exija una precisión del 100 %. Cuando me reúno con las partes interesadas, insisto en establecer el nivel de calidad de datos que se requiere, al tiempo que establezco expectativas de lo que se necesitará para lograrlo.
Cómo dirigirse a las partes interesadas
La confianza es un elemento de los procesos, pero también se ve impulsada por las audiencias de partes interesadas que la usan. Hay tres audiencias de partes interesadas principales:
Superusuarios
Una de las audiencias más nuevas y más impactantes es la de los superusuarios. Estos defensores de los datos son analíticos por naturaleza y desean tener la facultad de transformar los datos para, así, impulsar un cambio. Los superusuarios de datos quieren ser relativamente autónomos y capaces de adoptar un enfoque cognitivo frente a la resolución de problemas. En vez de esperar un informe, esperan contar con un fácil acceso a los cuadros de mandos y a las herramientas de visualización de datos.
Estos nuevos superusuarios representan una pequeña parte de los usuarios, pero ya no están solo en puestos ejecutivos. En toda la organización, desde el personal de atención al cliente hasta los altos directivos, cada vez más equipos dependen de los datos para tomar decisiones. Los superusuarios lo ayudarán a impulsar una adopción generalizada en toda la empresa. Su estrategia de datos necesita alinearse con estos consumidores de datos, la forma en que usan los datos y sus puntos débiles.
Propietarios de datos
Este grupo tiene los datos que se están analizando. Asegúrese de que los propietarios de datos y sus sistemas no transmitan datos incorrectos. Para garantizar datos limpios en el front-end, ayúdelos a desarrollar procesos y métodos de recopilación que estén impulsados por las mejores prácticas.
Organice reuniones periódicas con los propietarios de datos para hablar sobre qué no funciona o qué presenta fallas de manera constante. La presión social que generan estas interacciones obliga a los propietarios a estar más atentos y les hace comprender mejor el impacto de sus acciones en todo el ciclo de vida de los datos. Su estructura de administración de datos debe incluir recursos dedicados para administrar la recopilación, la calidad, la generación de informes y el control como funciones separadas pero interrelacionadas.
Usuarios comerciales
La dirección ejecutiva debe fomentar todo plan de transformación de datos, desde la priorización hasta el presupuesto. Sin embargo, las necesidades y frustraciones de los líderes y gerentes de toda la empresa también completarán su lista de tareas. Reunir un organismo de control de datos completo aporta la perspectiva de todos los participantes al proceso. Lo ideal es contar con un grupo de personas eclécticas de su organización que represente los aspectos técnicos de esta junto con los defensores del negocio que se orienten a los detalles y comprendan las necesidades comerciales.
Esfuércese por crear un ciclo de comentarios en donde pueda difundir información técnica relevante y sus usuarios le aporten información valiosa del negocio. Dentro de este grupo, puede determinar los procesos de cambio, los controles básicos e identificar programas que respalden de mejor manera las necesidades del negocio. Incluya en este grupo a aquellos superusuarios que puedan impulsar la adopción, fomentar la confianza y crear una reacción en cadena en torno a las mejores prácticas.
El escenario de los datos en evolución
Eso nos deja un escenario de datos en evolución poblado con nuevos tipos de usuarios. Como profesionales de los datos, nuestra misión es proveer datos confiables e inspirar confianza en esos datos. Incluso si sabemos que nuestros datos son seguros, están definidos y son de alta calidad, necesitamos poder demostrarlo.
Me gusta la idea de tener un sello tipo ISO que visualmente indique que los datos se han revisado y son de confianza. Sumado a un versionado estricto, este sello puede ayudar a los usuarios a identificar al instante los datos depurados y los datos que posiblemente no sean actuales o cuyo uso no sea seguro. Por supuesto, para llegar a la etapa de los sellos de confianza, se necesita tener diccionarios de datos y catálogos de metadatos sólidos implementados para que todos sepan de qué se habla.
Los registros y los permisos de auditoría son otra manera de inspirar confianza y, en general, se los menciona desde una perspectiva del cumplimiento de normas y de la seguridad. Saber que solo el personal autorizado manipula los datos aumenta la confianza en lo que respecta a la precisión. Aunque algunos pueden considerar esto como una restricción del acceso, con los controles y contrapesos correctos, puedo democratizar información sin ponerla en peligro.
La educación encierra todas estas actividades. La alfabetización de los datos une todo para que los usuarios tengan una comprensión rudimentaria de por qué los datos son tan esenciales y cómo usarlos de manera adecuada. Entender que ciertas reglas de ortografía y formato para ingresar los datos de los clientes son cruciales para alimentar esos datos en otros sistemas permite a los usuarios formar parte de la solución.
Destino: datos confiables
Entonces, ¿cómo sé que mis datos son confiables? Veo que la gente los usa. Se usan para tomar decisiones y generar discusiones y preguntas estimulantes de la empresa. Puedo medir el uso del cuadro de mandos y el resultado de las mejores decisiones tomadas con datos válidos. Los costos iniciales del recorrido (los recursos, los plazos y el presupuesto) serán más altos para las organizaciones establecidas que para las empresas que nacieron en la nube, pero los principios son los mismos. Y, al igual que los datos de calidad, el esfuerzo que se pone en alinear personas, procesos y metas en la interfaz del usuario generará una base sólida de datos que puede respaldar su futuro éxito independientemente de la industria, el tamaño de la empresa o los ingresos.
¿Dónde debería empezar?
Al igual que con cualquier proyecto de transformación, la limpieza de datos no es un proyecto puntual. Es continuo, y el apoyo ejecutivo y una visión a largo plazo son elementos fundamentales. Se requiere de una infraestructura de administración de cambios que pueda adaptarse a un escenario de datos en constante cambio.
Cuando cambian las necesidades o las políticas, se presenta un efecto cascada en la lógica que se integra al código. Se necesita de un equipo que pueda pensar en toda la cadena de datos, de dónde proviene y a qué abastece, para mantener la calidad de los datos. Y los líderes deben comunicar de forma clara el recorrido previsto de la empresa y la función de los datos en este recorrido. Luego deben darle un lugar prioritario a la administración de la cadena de datos.
Entonces, ¿dónde empezar? Empiece de a poco. Elimine la sensación de agobio que puede acompañar a un proyecto de transformación de datos y comience con un proyecto a pequeña escala pero significativo. Primero, céntrese en los datos necesarios para dirigir el negocio (ventas, tasa de cancelación, cumplimiento), luego pase a los datos que posibilitan la eficacia (experiencia del cliente, mejoras en el proceso comercial, optimización de la cadena de suministro).
Creo que los datos son un producto, no un servicio. Como tal, abordamos el diseño, la producción y la distribución en una infraestructura de entrega de productos con elementos incorporados de control de calidad, monitoreo y respuesta. Logre eso primero, haga que la gente lo entienda, lo use y confíe en ello; luego, pase a otras áreas o a plataformas más importantes. A medida que despliega programas nuevos, contará con esta confianza establecida.
¿Sus datos del cliente están listos para la IA?
About the Authors
Chief Information Officer
Juan Riojas
As Chief Information Officer at Rackspace Technology, Juan Riojas is responsible for enterprise-wide data strategy, management, and analytics to meet the need of the business to answer critical questions through time to insight. He has more than 20 years of industry experience successfully migrating data ecosystem across all public clouds, leading to significant business transformation outcomes. Prior to Rackspace, Juan worked for Informatica building their inaugural Data Office and has held various executive leadership roles at Gogo, Dell, Accenture, and Expeditors. A native of Texas, Juan attended Texas A&M International University, where he studied business administration and holds a post graduate degree from Said Business School, Oxford University
Read more about Juan Riojas