O caminho para os dados confiáveis
Se as partes interessadas não podem confiar nos dados para tomar decisões importantes, que sentido há em coletá-los, armazená-los e protegê-los?
Colaboradores: Eduardo Coccaro, Jared Jacobson
Os dados são um motor. Eles podem aumentar a eficiência de aplicativos, gerar insights de clientes, direcionar decisões comerciais e acelerar a inovação de produtos. E, quando gerenciados adequadamente, são o alicerce dos esforços eficazes de automação, aprendizagem de máquina e inteligência artificial (IA). Oito em cada dez executivos entrevistados acreditam estar em uma corrida contra seus concorrentes para extrair valor dos dados. Como diretor de dados (CDO), eu sou um deles.
Embora os dados possam ter um grande potencial, também podem ser seu arqui-inimigo. Repositórios de dados não estruturados, isolados e mal gerenciados, sem estratégia unificada, não são apenas inúteis, mas também tóxicos. Indiscutivelmente, o pior efeito colateral dos dados sujos é o fator confiança – ou a falta dele. Se as partes interessadas não podem confiar nos dados para tomar decisões importantes, qual é o sentido de coletá-los, armazená-los e protegê-los?
O impacto dos dados sujos
Dados sujos podem acarretar decisões equivocadas, erros de cálculo onerosos e impactos negativos em qualquer projeto orientado a dados. Um terço dos profissionais de TI aponta a má qualidade dos dados como a principal razão pela qual muitos projetos de IA e de aprendizagem de máquina demoram mais do que o planejado, custam mais do que o esperado e não fornecem resultados úteis.
Conforme as empresas começam a aproveitar os dados internos, a maioria descobre que eles não são tão limpos ou confiáveis quanto esperavam. Colocar o foco apenas em como explorar os dados existentes ignora o trabalho prévio necessário para se coletar e manter dados limpos. No passado, já vi empresas entrarem com tudo na coleta de dados, em busca de um rápido retorno analítico. Porém, quando o "lixo que entra" produz "lixo que sai", elas ficam decepcionadas com a qualidade dos insights gerados, pois nunca houve foco em qualidade no início da coleta e do gerenciamento dos dados.
A Gartner relata que dados sujos desperdiçam cerca de US$ 15 milhões por ano. Esse desperdício inclui os recursos – servidores, aplicativos e conhecimento – dedicados à manutenção de dados que nem ao menos são utilizáveis. Talvez eu tenha TBs de dados na ponta dos dedos, mas isso não significa necessariamente que sejam os dados certos para gerar as ideias certas para a minha empresa.
Adicione a tudo isso a ofensiva de novas fontes, tipos e riscos de dados. A maioria dos dados armazenados nos servidores hoje em dia foi criada nos últimos cinco anos, a partir do acesso cada vez maior que temos aos dados de mídias sociais, informações de consumidores, dispositivos móveis e sensores de IoT. Além de haver mais dados, eles também estão chegando mais rapidamente, com ajuda das tecnologias 5G e de computação de borda. Armazenar e proteger essa enorme quantidade de dados, dos quais apenas uma porcentagem é realmente útil, pode custar muito dinheiro e, ao mesmo tempo, colocar você na mira dos reguladores de conformidade por manejo incorreto dos dados ou torná-lo vítima de hackers experientes.
O que são dados confiáveis?
É por todos os motivos acima que meu trabalho, diretor de dados, tem se tornado mais prevalente no setor. Designar um líder para controlar todos os dados de uma empresa é essencial para criar dados precisos e confiáveis.
A maioria das empresas não sabe por onde começar quando se trata de analisar os dados que acumularam. Os desafios comuns se concentram em identificar e limpar os dados de alto impacto e fazer as partes interessadas confiarem neles. Meu objetivo como CDO é garantir que todos os dados da minha organização atendam aos seguintes critérios:
- Os dados devem estar seguros
- Os dados devem estar definidos
- Os dados devem atender aos padrões de qualidade
As definições de cada critério vão variar de uma organização para outra. Eu uso estas definições gerais para atingir esses objetivos:
Segurança
Dados seguros são protegidos por criptografia e outras medidas de segurança. Além disso, devem cumprir os requisitos de privacidade, conformidade e demais regulamentos do setor.
Definidos
Embora seja difícil criar definições empresariais comuns e padronizadas para os dados, isso é um elemento essencial para estabelecer confiança. Alinhe-se internamente quanto à terminologia, para que haja consenso sobre as métricas a serem avaliadas e a definição delas. Você pode ter várias definições para o mesmo tipo ou origem de uma métrica, mas precisa defini-los de maneira diferente para garantir clareza.
Qualidade
O elemento mais variável dos dados confiáveis é a qualidade. Um varejista pode ficar satisfeito com 95% de precisão no tráfego da loja, enquanto um centro médico talvez demande 100% de precisão. Quando me sento com as partes interessadas, faço questão de estabelecer o nível exigido na qualidade dos dados e o que será necessário para atingi-lo.
Como tratar partes interessadas
A confiança é um elemento dos processos, mas também é motivada pelo público que a utiliza. Existem três públicos principais entre as partes interessadas:
Superusuários
Um dos públicos mais novos, mas mais impactantes, é o dos superusuários. Esses defensores de dados são analíticos por natureza e desejam ter poderes para reunir dados a fim de gerar mudanças. Os superusuários de dados desejam ser relativamente autônomos e capazes de adotar uma abordagem cognitiva para a solução de problemas. Em vez de aguardar um relatório, eles esperam fácil acesso a painéis e ferramentas de visualização de dados.
Esses superusuários novatos representam uma pequena parcela dos usuários, mas atualmente não estão apenas no escalão executivo. Em toda a organização, da linha de frente à diretoria, cada vez mais equipes dependem dos dados para tomar decisões. Os superusuários ajudarão você a estimular a adoção generalizada na empresa toda. Sua estratégia precisa estar em compasso com esses consumidores de dados — e considerar como eles usam os dados e seus pontos problemáticos.
Proprietários de dados
Este grupo mantém os dados que estão sendo analisados. Assegure-se de que os proprietários de dados e seus sistemas não estejam transmitindo dados incorretos. Para garantir dados limpos no front-end, ajude-os a desenvolver processos e métodos de coleta baseados em melhores práticas.
Realize reuniões periódicas com os proprietários de dados para conversar sobre o que está corrompido ou com falhas constantes. A pressão gerada por essas interações força os proprietários a ficarem mais atentos, ao mesmo tempo em que oferece uma melhor compreensão de como as ações deles afetam o ciclo de vida dos dados. Sua estrutura de gerenciamento de dados deve incluir recursos dedicados para gerenciar coleta, qualidade, relatórios e governança como funções separadas, mas interligadas.
Usuários empresariais
A liderança executiva deve conduzir todos os planos de transformação de dados – da priorização ao orçamento. No entanto, as necessidades e frustrações de líderes e gerentes de toda a empresa também direcionarão sua lista de tarefas. Montar um grupo completo de governança de dados traz a perspectiva de todos para o processo. Será útil ter um grupo eclético de pessoas que representem os aspectos técnicos da organização, juntamente com defensores comerciais inclinados aos detalhes e com compreensão das necessidades do negócio.
Esforce-se para criar um ciclo de feedback no qual você divulgue informações técnicas relevantes e os usuários tragam insights valiosos da empresa. Dentro desse grupo, você pode determinar processos de mudança, controles básicos e identificar os programas que melhor apoiem as necessidades dos negócios. Inclua nesse grupo superusuários que sejam capazes de impulsionar a adoção, incentivar a confiança e criar um efeito cascata quanto ao seguimento de melhores práticas.
O cenário de dados em evolução
Isso nos deixa com um cenário de dados em evolução, habitado por novos tipos de usuários. Como profissionais, nossa missão é fornecer dados confiáveis e suscitar a confiança nesses dados. Mesmo se soubermos que nossos dados são seguros, definidos e de alta qualidade, precisamos ser capazes de provar.
Gosto da ideia de um selo semelhante ao ISO para indicar visualmente que os dados foram revisados e são confiáveis. Combinado a um rigoroso controle de versão, esse selo pode ajudar os usuários a identificar instantaneamente dados que estejam imaculados, bem como dados possivelmente desatualizados ou inseguros para uso. Obviamente, para chegar ao estágio do selo de confiança, você precisa ter robustos dicionários de dados e catálogos de metadados para que todos falem a mesma língua.
Geralmente referenciadas pela perspectiva de conformidade e segurança, as trilhas e permissões de auditoria são outra maneira de inspirar confiança. Saber que os dados estão sendo manipulados apenas por pessoal autorizado aumenta a confiança na precisão deles. Embora alguns possam enxergar isso como restrição de acesso, com as devidas verificações e balanceamentos em vigor, consigo democratizar melhor as informações sem colocá-las em risco.
Em volta de todas essas atividades está a educação. A alfabetização em dados une tudo isso para que os usuários tenham uma compreensão rudimentar de por que os dados são tão vitais e de como usá-los adequadamente. Compreender que certas regras de ortografia e formatação na inserção dos dados do cliente são cruciais para alimentar esses dados em outros sistemas capacita os usuários para que se tornem parte da solução.
Destino: dados confiáveis
Então, como sei que meus dados são confiáveis? Eu vejo se as pessoas os estão usando. Se estão sendo aproveitados para a tomada de decisões e para estimular perguntas e discussões comerciais. Consigo medir a utilização dos painéis e o resultado de decisões melhores baseadas em dados válidos. Os custos iniciais da jornada – recursos, cronogramas, orçamento – serão mais altos para as organizações estabelecidas do que para as empresas nascidas na nuvem, mas os princípios são os mesmos. E, assim como bons dados, o esforço empreendido para alinhar pessoas, processos e objetivos no front-end produzirá uma base de dados sólida e capaz de apoiar o seu sucesso futuro, independentemente do setor, do tamanho da empresa ou da receita.
Por onde você deve começar?
Assim como qualquer projeto de transformação, a higienização de dados não é um projeto do tipo "fiz e acabou". É um projeto contínuo, no qual apoio executivo e visão de longo prazo são elementos vitais. Isso requer uma estrutura de gerenciamento de mudanças capaz de acomodar um cenário de dados em constante mutação.
Quando as necessidades ou políticas mudam, há um efeito cascata na lógica inserida no código. Você precisa de uma equipe que possa considerar toda a cadeia — onde ela se origina e o que ela abastece — para manter a qualidade dos dados. E a liderança deve comunicar claramente o caminho pretendido da empresa e o papel dos dados para percorrer esse caminho. E, em seguida, a liderança deve tornar o gerenciamento da cadeia de dados uma prioridade.
Então, por onde começar? Comece pequeno. Remova a sensação de sobrecarga que pode acompanhar um projeto de transformação de dados começando com algo pequeno e significativo. Concentre-se primeiro nos dados de condução comercial (vendas, rotatividade, atendimento), passando depois para os dados que propiciam eficiência (experiência do cliente, melhoria de processos de negócio, otimização da cadeia de suprimentos).
Eu enxergo os dados como um produto, não como um serviço. Sendo assim, abordamos o design, a produção e a distribuição em uma estrutura de entrega de produto com elementos de controle de qualidade, monitoramento e resposta incorporados. Conquiste a primeira vitória com os dados, faça com que as pessoas entendam, usem, confiem neles — e depois expanda para outras áreas ou plataformas maiores. Ao lançar novos programas, você terá essa confiança estabelecida.
Os dados dos seus clientes estão prontos para IA?
About the Authors
Chief Information Officer
Juan Riojas
As Chief Information Officer at Rackspace Technology, Juan Riojas is responsible for enterprise-wide data strategy, management, and analytics to meet the need of the business to answer critical questions through time to insight. He has more than 20 years of industry experience successfully migrating data ecosystem across all public clouds, leading to significant business transformation outcomes. Prior to Rackspace, Juan worked for Informatica building their inaugural Data Office and has held various executive leadership roles at Gogo, Dell, Accenture, and Expeditors. A native of Texas, Juan attended Texas A&M International University, where he studied business administration and holds a post graduate degree from Said Business School, Oxford University
Read more about Juan Riojas