Ganhe o jogo no longo prazo priorizando a ética dos dados
As organizações precisam de padrões éticos para se manter competitivas.
A moralidade não é um conceito rigidamente definido, especialmente no que tange ao complexo tema da ética de dados. Essa nova área de análise ética aplica o princípio da não maleficência para examinar como as organizações usam os dados. Em um mundo perfeito, os dados seriam usados para beneficiar consumidores, funcionários e outros grupos.
De governos a empresas, inúmeras organizações fazem uso de dados, e cada uma delas tem um conjunto diferente de valores. Esses valores devem ser o ponto de partida para estabelecer um programa de ética que propicie transparência no uso dos dados. Um programa de ética de dados bem definido permite que a organização decida o que está ou não alinhado com seus valores.
Nos últimos cinco a dez anos, as organizações se concentraram em coletar o máximo possível de dados. Depois de acumulados, eles são usados para derivar análises ou empregados em um fluxo de trabalho de machine learning. Se não gerenciado corretamente, o acúmulo maciço de dados pode representar um risco à segurança. E, no caso dos dados pessoais, acaba suscitando questões de privacidade e proteção.
Na minha experiência, a maioria das organizações não está priorizando a ética de dados, e isso é parte do problema. O foco tende a recair em como a organização usa os dados para criar valor para acionistas ou clientes. O Facebook, por exemplo, extrai continuamente insights dos dados para guarnecer os anunciantes, mas será que isso é feito de forma ética?
Motivos para ter um programa de ética de dados
As organizações que implementarem um programa de ética de dados ganharão vantagem competitiva. Essas organizações conquistarão a confiança do cliente ao demonstrar que priorizam a privacidade e podem propiciar total transparência com uma cadeia ética de abastecimento de dados.
Em uma cadeia ética de abastecimento de dados, a organização rastreia os dados ao longo de toda a jornada e consegue explicar o que está acontecendo em cada estágio, ao mesmo tempo em que assegura o cumprimento das normas. É a jornada completa dos dados, da coleta ao destino, para, por exemplo, otimizar a experiência do cliente ou balizar uma decisão comercial.
As organizações que consideram apenas o impacto econômico imediato do uso de dados vão ficar para trás. Empresas pansóficas e esclarecidas que têm um programa de ética de dados e entendem seus clientes e stakeholders, bem como suas obrigações com o meio ambiente, são mais atraentes para os clientes. Da mesma forma, os profissionais de tecnologia também estão procurando organizações que se alinhem com seus valores. Os candidatos já começam a verificar se existe programa de ética de dados quando pensam em trabalhar para uma empresa.
A Apple alega ter uma vantagem ética em relação ao uso de dados por não coletar dados pessoais, e tem usado isso como um selo para se diferenciar dos concorrentes.
Práticas recomendadas para seu programa de ética de dados
A explicabilidade dos dados e uma cadeia ética de abastecimento são apenas dois dos elementos de um programa de ética completo. Explicabilidade significa oferecer transparência no uso de dados e algoritmos. Ela propicia, por exemplo, o entendimento de como as decisões são tomadas pelos modelos de machine learning, o que, por sua vez, pode ajudar a identificar vieses. A aplicação da explicabilidade dos dados cria os freios e contrapesos para garantir que os dados sejam usados de forma ética. Ela fornece visibilidade dos pipelines para evidenciar por quem, quando e como os dados estão sendo usados.
E, para criar uma cadeia ética de abastecimento de dados, as organizações estão começando a refletir antecipadamente sobre a utilização deles. Que problema os dados tentarão resolver? Que experiência ajudarão a criar para o cliente? É mesmo necessário coletar esse conjunto de dados?
Outra consideração é a exposição dos dados. As organizações precisam estabelecer quais fragmentos de dados serão expostos aos diferentes usuários e como tais dados serão usados. Deve haver em vigor salvaguardas para impedir o acesso aos dados por motivos eticamente questionáveis. Por exemplo, o funcionário de um site de varejo não deve ser capaz de acessar e visualizar os hábitos de compra de um cliente individual. A necessidade de proteger os dados em nível individual constitui um argumento para a anonimização deles, o que poderia solucionar diversos problemas éticos, especialmente dos dados pessoais.
Como implementar um programa de ética de dados
Ter adesão organizacional é o primeiro passo para estabelecer um programa de ética de dados. A liderança precisará firmar a expectativa de que os padrões éticos serão mantidos no longo prazo. O treinamento dos funcionários deverá estabelecer ações aceitáveis e proibidas com relação ao uso de dados. E você precisará estabelecer um conselho de ética de dados formado por representantes de diferentes funções empresariais, aptos a contribuir na decisão sobre os casos controversos de uso de dados.
Quando se trata de projetos ou iniciativas individuais, comece a planejar cedo, pois é mais fácil implementar freios e contrapesos na estaca zero. Isso inclui mapear exatamente como será a cadeia de abastecimento, para que os dados certos sejam coletados nos pontos certos.
Cuidado com o viés do machine learning
O machine learning é cada vez mais importante para as organizações otimizarem processos ou criarem valor adicional, entre outras coisas. Uma constatação fundamental em nosso Relatório de Pesquisa Anual de IA/ML 2022 foi que a IA/ML já é a segunda tecnologia mais importante para a estratégia de TI, ficando atrás apenas da segurança cibernética. Vemos exemplos diários de como o machine learning se tornou frequente em nossas vidas — desde assistentes virtuais como Alexa e Siri a recomendações de música e sugestões de texto para nossos e-mails. Os algoritmos de machine learning são criados por pessoas e, mesmo sendo possível utilizar o código para melhorar o processo, as pessoas ainda estão envolvidas.
Com as pessoas na equação, podem ocorrer vieses, intencionais ou não. Para evitá-los, as organizações devem levar em consideração como os modelos de machine learning são desenvolvidos. É preciso ter controles em vigor. Por exemplo, a amostra de dados é grande o suficiente? Os dados são representativos da população? Perguntas assim impedirão que a organização inocule inferências em suas operações.
Quando as organizações não consideram esses fatores, a falta de uma estratégia ética de dados pode ter impacto social. Por exemplo, uma fintech com modelos de machine learning enviesados poderá negar crédito ou recusar empréstimo a um candidato idôneo. O viés pode ser oriundo de fatores como raça, gênero ou situação socioeconômica. A correlação talvez faça sentido em alguns casos, mas, em outros, pode ser vista como injustificável.
Um exemplo recente disso foi quando a Apple fez uma parceria com a Goldman Sachs para lançar um cartão de crédito. Um desenvolvedor de software e sua esposa forneceram as mesmas informações, mas, devido ao viés de gênero, o marido recebeu um limite de crédito 20 vezes maior que o da esposa.
A ascensão do diretor de ética
Muitas organizações grandes de tecnologia, incluindo Facebook e Google, já estão empregando equipes de ética de dados. Algumas delas até contrataram um diretor de ética. Porém, será que tais equipes e executivos são capazes de gerar mudanças? Qual é a diretiva deles? Seriam essas funções uma reação às pressões externas? No momento, não está claro se essas equipes são eficazes, e será interessante ver como tais funções se desenvolvem.
Todas as entidades devem prestar contas
É importante que os clientes indaguem sobre o uso de seus dados pessoais. As pessoas ficariam surpresas se soubessem o tanto que as empresas coletam dados a partir de cliques, sites e aplicativos e, possivelmente, até compartilham esses dados com outras organizações. Qualquer lugar em que você precise fazer login com senha está sendo monitorado. Os indivíduos deveriam ler as divulgações de dados para entender como as organizações aproveitam os dados.
Ao compreender e questionar o uso dos dados, podemos responsabilizar todas as entidades. Todos nós precisamos garantir que as organizações sejam éticas no uso dos dados, pois isso não afeta apenas os indivíduos, mas também sociedade.
A Internet do Comportamento: o que é? Será que devemos nos preocupar?
About the Authors
General Manager, Data Services
Nihar Gupta
With over 10 years of experience working with high-growth SaaS/Tech companies, Nihar helps companies achieve their growth objectives through strategic partnerships, corporate development efforts, and executing cross-functional strategic initiatives. He brings significant breadth of experience across strategy, finance, product, and sales and marketing.
Read more about Nihar GuptaRelated Topics