Man's to the right

Deixemos de lado a discussão "AutoML vs. cientista de dados"

Em vez de escolher se vão investir em AutoML ou em cientistas de dados, os líderes tecnológicos devem reconhecer que o futuro está em ambos.

À medida que os líderes de tecnologia tentam aplicar o machine learning para resolver problemas de negócios, devem abandonar a problemática acerca de investir em automação ou em talentos humanos da ciência de dados, sob o risco de perder o valor comercial de ambos.

Temos constatado a adoção bem-sucedida da automação para gerenciar infraestrutura e aplicar práticas de integração contínua/entrega contínua (CI/CD) para reduzir os cronogramas de implementação. Em ambos os casos, a automação substitui processos manuais que são tediosos, demorados e propensos a erros — aumentando a eficiência e liberando recursos humanos para um trabalho mais impactante.

O AutoML (machine learning automatizado) promete fazer exatamente isso para o aprendizado de máquina.

As tarefas que as ferramentas AutoML executam são mais elaboradas, já que o machine learning é exponencialmente mais complexo do que infraestrutura ou CI/CD. Essa é uma ótima notícia para os líderes de tecnologia. Automatizar com êxito um fluxo de trabalho mais complexo significa que as empresas podem colher recompensas maiores com menos esforço. Como os conjuntos de habilidades dos cientistas de dados são caros e difíceis de encontrar, as ferramentas AutoML permitirão que as organizações acessem os benefícios das soluções de machine learning a custos mais razoáveis.

Isso naturalmente tem levado os líderes tecnológicos e a comunidade da ciência de dados a comparar o AutoML com os humanos, questionando qual é melhor e se os cientistas de dados serão deixados para trás. Mas a resposta dessa pergunta não está tão claramente definida. Vamos examinar o porquê e explorar outras perguntas que deveríamos fazer em vez dela.

O AutoML é melhor do que um cientista de dados?

No caso do machine learning, a métrica para "melhor" flutua com base no problema empresarial que você está tentando resolver.

As ferramentas AutoML levam vantagem sobre os cientistas de dados humanos em velocidade e redução de riscos; mas o cérebro humano supera a máquina de outras maneiras. O cientista de dados traz ao processo um nível de nuance, intuição e resolução criativa de problemas que o AutoML simplesmente não consegue igualar.

Perguntar se o AutoML é melhor do que o machine learning construído por humanos é como perguntar se é melhor alugar uma impressora 3D ou contratar um escultor com mestrado; a resposta depende do que você quer extrair do produto. 

Você quer uma criação detalhada e inovadora para resolver um problema novo ou um mecanismo que se encaixe nas dimensões e no peso corretos?

Como uma impressora 3D, as ferramentas AutoML podem atingir um nível aceitável de precisão em muito menos tempo do que um ser humano. Caso seja o suficiente para o caso de uso em questão, por que não usar o AutoML em vez de horas humanas? Com a automação, você renuncia ao controle total em favor da eficiência, ficando com capacidade limitada de acessar e ajustar os modelos ou algoritmos subjacentes da sua solução. Quando o caso de uso é mais complexo, o toque humano é crucial. Um cientista de dados pode criar soluções mais diferenciadas e com desempenho mais alto para aplicativos complexos de machine learning, como engenharia de recursos e conjunto de modelos — ao mesmo tempo em que mantém controle completo sobre os modelos e algoritmos que cria.

Em outros casos, a métrica para "melhor" não está vinculada aos resultados, mas às habilidades que a organização tem prontamente disponíveis. Nem todas as empresas têm uma equipe de cientistas de dados qualificados ou a necessidade urgente de investir em tal equipe. Em casos assim, pode-se dizer que o AutoML se encaixa "melhor" simplesmente porque permite que as organizações façam mais com as habilidades internas que possuem.

O AutoML substituirá os cientistas de dados?

Em resumo, sim. Já estamos vendo isso acontecer.

Nos casos em que uma máquina possa construir um modelo de machine learning de forma mais eficiente e ainda alcançar uma faixa aceitável de precisão, faz sentido as organizações optarem pelo AutoML. Essas ferramentas abrem a porta para que os desenvolvedores sem formação clássica em ciência de dados acessem o machine learning. Estamos vendo mais engenheiros de software desenvolvendo conhecimento em machine learning no trabalho, formando um novo contingente de "cientistas de dados cidadãos". Talvez eles não tenham a experiência necessária para criar modelos complicados de machine learning, mas podem aproveitar as ferramentas AutoML para resolver problemas reais para suas organizações.

Embora o AutoML possa comportar parte do fluxo de trabalho de machine learning sem a necessidade de cientistas de dados, isso não significa que o conjunto de habilidades da ciência de dados se tornará obsoleto. Cientistas de dados treinados de forma clássica são igualmente importantes, ou até mais, agora que mais organizações podem acessar o AutoML.

A discussão "AutoML vs. cientista de dados" é inerentemente falha, e nós incentivamos os líderes de tecnologia a mergulharem na verdadeira questão: como as empresas podem aproveitar totalmente o AutoML e os cientistas de dados?

Com o AutoML, os cientistas de dados são os reais vencedores

Os líderes de tecnologia inteligente estão percebendo rapidamente que não se trata de escolher entre AutoML ou cientistas de dados, mas de elaborar uma estratégia para tirar proveito de ambos. O AutoML só fará aumentar o valor dos cientistas de dados humanos.

Os cientistas de dados que adotarem o AutoML poderão se expandir mais profundamente nas capacidades do machine learning e se tornar ainda mais eficazes no que fazem. No tempo que levaria para um cientista de dados fazer dez experimentos, agora é possível realizar uma centena deles. Os cientistas de dados experientes veem isso como uma oportunidade de passar a maior parte do tempo explorando problemas técnicos de forma mais exaustiva, trazendo retornos muito maiores para suas organizações.

Os cientistas de dados vitoriosos adotarão as ferramentas AutoML da forma como a indústria da construção adota as ferramentas de painelização e pré-fabricação: como um mecanismo para reduzir o tempo gasto em tarefas repetitivas e permitir que a máquina prepare os materiais necessários à realização de trabalhos mais especializados.

Esqueça a discussão "AutoML vs. cientista de dados" — você precisará de ambos

É inútil tentar estabelecer um vencedor na disputa entre AutoML e cientista de dados. A discussão futura não abarca AutoML ou cientistas de dados, e sim AutoML e cientistas de dados.

Os cientistas de dados que adotarem o AutoML como um acelerador de potencial serão os reais vencedores.

Os líderes de tecnologia devem adotar o AutoML não como um substituto individual para o cientista de dados, mas como uma maneira de começar a colher os benefícios do machine learning antes de criar um conjunto interno de habilidades em ciência de dados — e também como forma de impulsionar o impacto dos cientistas internos que já possuem. As organizações perspicazes podem começar a mergulhar no AutoML agora mesmo e, com o apoio de um conjunto de habilidades de desenvolvedor, garantir uma preparação melhor para recrutar talentos de primeira linha em ciência de dados à medida que avançarem.

 

Join the Conversation: Find Solve on Twitter and LinkedIn, or follow along via RSS.

Stay on top of what's next in technology

Learn about tech trends, innovations and how technologists are working today.

Subscribe
Trends-Ebook

Está cansado de navegar pelas tendências de tecnologia e evitar o hype?

About the Authors

Eric Miller - Senior Director, Technical Strategy, Rackspace Technology

VP, Private Cloud Solutions

Eric Miller

An accomplished tech leader with 20 years of years of proven success in enterprise IT, Eric is a strong advocate of cloud native architectural patterns, passionate about Machine Learning, IoT, Serverless, and all things automation in the cloud. Eric has led several AWS and solutions architecture initiatives, including AWS Well Architected Framework (WAF) Assessment Partner Program, Amazon EC2 for Windows Server AWS Service Delivery Program, and a wide range of AWS rewrites for multi-billion dollar organizations.  Prior to joining Rackspace, Eric was the Vice President of AWS Customer Solutions at Onica, which was acquired by Rackspace in 2019. Before working with Onica, Eric held several technology leadership positions at School Pointe, Inc., Neudesic, m2 Consultants, ARGUS International, Inc., Apex Mortgage Services LLC, and TechSkills. Eric lives in New Albany, Ohio with his wife and family. He holds a Bachelor of Science in Information Technology and Information Systems Security from the University of Phoenix.  

Read more about Eric Miller
Mark McQuade

Practice Manager, Data Science & Engineering

Mark McQuade

Mark McQuade is an AWS and cloud-based solution specialist, knowledge addict and relationship builder. Earlier in his career, Mark held technical support, operations, business development and leadership roles for a telecommunications solutions provider, where he worked for 13 years. He then transitioned to the world of cloud and opened up his own AWS small business before joining Onica, who was acquired by Rackspace technology in 2019.   Mark is currently Practice Manager of Data Science & Engineering at Rackspace Technology. Every day, he gets to learn more about what he is passionate about professionally – AI and machine learning – as well as the fascinating world of data. As a technology evangelist, you’ll often find Mark promoting data and AI/ML at talks, webinars, podcasts and industry events.

Read more about Mark McQuade