Man's to the right

Dejemos de lado la discusión entre el AutoML y los científicos de datos

En lugar de elegir invertir en AutoML o en científicos de datos, los líderes en tecnología deben reconocer que el futuro está en ambos.

Mientras que los líderes en tecnología buscan aplicar el machine learning para resolver los problemas comerciales, deben dejar de lado la pregunta acerca de si invertir en automatización o en talento humano en ciencia de datos, o arriesgarse a perder el valor comercial de ambos.

Hemos visto que se ha adoptado con éxito la automatización para administrar la infraestructura y aplicar prácticas de integración continua/entrega continua (CI/CD), a fin de reducir los plazos de implementación. En ambos casos, la automatización reemplaza los procesos manuales que son tediosos, consumen mucho tiempo y son propensos a errores. Además, aumenta la eficiencia y deja que haya disponibles recursos humanos para realizar un trabajo que tenga un mayor impacto.

El machine learning automático (AutoML) promete hacer exactamente eso para el machine learning.

Las tareas que realizan las herramientas de AutoML son más elaboradas, ya que el machine learning es exponencialmente más complejo que la infraestructura o la CI/CD. Esta es una muy buena noticia para los líderes en tecnología. La automatización exitosa de un flujo de trabajo más complicado significa que las empresas pueden obtener mayores recompensas con menos esfuerzo. Dado que los conjuntos de habilidades de los científicos de datos son costosos y difíciles de conseguir, las herramientas de AutoML permitirán a las organizaciones acceder a los beneficios de las soluciones de machine learning a costos más razonables.

Esto ha impulsado de forma natural a los líderes tecnológicos y a la comunidad de la ciencia de datos a comparar el AutoML con los seres humanos, preguntándose cuál es mejor y si los científicos de datos quedarán en el olvido. Pero la respuesta a esta pregunta no está claramente definida. Analicemos por qué y exploremos algunas otras preguntas que deberíamos hacer.

¿El AutoML es mejor que un científico de datos?

En el caso del machine learning, la métrica para "mejor" fluctúa en función del problema comercial que usted intenta resolver.

Las herramientas de AutoML tienen ventajas sobre los científicos de datos humanos en lo que respecta a la velocidad y a la reducción de riesgos, pero el cerebro humano es superior a una máquina de otras maneras. Un científico de datos aporta a un proceso un nivel de matiz, intuición y resolución creativa de los problemas que el AutoML no puede igualar así nomás.

Preguntar si el AutoML es mejor que el machine learning creado por personas es como preguntarse si conviene alquilar una impresora 3D o contratar a un escultor que tiene una maestría. La respuesta radica en lo que uno necesita del producto. 

¿Busca una creación bien detallada e innovadora que resuelva un problema nuevo o un mecanismo que cumpla con las dimensiones y el peso correctos?

Como una impresora 3D, las herramientas de AutoML pueden alcanzar un nivel aceptable de precisión en mucho menos tiempo que una persona. Si es suficiente para el caso de uso comercial, ¿por qué no utilizar AutoML en lugar de horas de mano de obra? Con la automatización, renuncia al control total en favor de la eficiencia y queda con una capacidad limitada para acceder y corregir los modelos o algoritmos subyacentes para su solución. Cuando el caso de uso es más complejo, el aporte humano es fundamental. Un científico de datos puede crear soluciones más matizadas y con mayor rendimiento para aplicaciones complejas de machine learning, como la ingeniería de las características y el ensamblaje de modelos, al tiempo que mantiene un control completo de los modelos y algoritmos que desarrolla.

En otros casos, la métrica de "mejor" no se vincula con los resultados, sino con las aptitudes con las que cuenta una organización. No toda empresa tiene un equipo de científicos de datos especializados ni una necesidad urgente de invertir en dicho equipo. En estos casos, el AutoML puede calificarse como una "mejor" opción solo porque les permite a las organizaciones hacer más con las aptitudes internas que tienen.

¿Reemplazará el AutoML a los científicos de datos?

La respuesta es "sí". Ya estamos viendo que esto ocurre.

En los casos en los que una máquina puede desarrollar un modelo de machine learning más eficiente y todavía tener un rango de exactitud aceptable, tiene sentido que las organizaciones elijan el AutoML. Estas herramientas abren la posibilidad de que los programadores que no cuentan con antecedentes clásicos en ciencia de datos accedan al machine learning. Estamos viendo a más ingenieros de software desarrollar conocimiento en machine learning en el trabajo, y esto forma a un nuevo contingente de "ciudadanos científicos de datos". Es posible que no cuenten con la experiencia necesaria para diseñar modelos complicados de machine learning, pero pueden aprovechar las herramientas del AutoML para resolver problemas reales para sus organizaciones.

Aunque el AutoML puede soportar parte del flujo de trabajo del machine learning sin necesitar a los científicos de datos, eso no significa que el conjunto de aptitudes de la ciencia de datos se volverá obsoleto. Los científicos de datos con formación clásica son tan importantes, si no más, ahora que más organizaciones pueden acceder al AutoML.

La discusión entre el AutoML y los científicos de datos ha fracasado por naturaleza, y alentamos a los líderes en tecnología a profundizar en la pregunta real: ¿cómo las empresas pueden aprovechar plenamente el AutoML y los científicos de datos?

Los científicos de datos son los ganadores reales con el AutoML

Los líderes en tecnología inteligente se están dando cuenta rápidamente de que no se trata de elegir entre el AutoML o los científicos de datos, sino de elaborar una estrategia para sacar provecho de ambos. El AutoML solo aumentará el valor de los científicos de datos humanos.

Los científicos de datos que adopten AutoML podrán expandirse todavía más en las capacidades del machine learning y ser aún más eficaces en lo que hacen. En el tiempo en que un científico de datos tardaría en fabricar diez experimentos, ahora puede realizar centenares de experimentos. Los científicos de datos expertos ven esto como una oportunidad para pasar la mayor parte de su tiempo explorando los problemas técnicos de manera más exhaustiva, lo que les significará más beneficios para sus organizaciones.

Los científicos de datos exitosos adoptarán las herramientas de AutoML de la misma manera que la industria de la construcción adopta las herramientas de panelización y prefabricación: como un mecanismo para reducir el tiempo que dedican a tareas repetitivas y permitir que una máquina prepare los materiales que necesitan para realizar un trabajo más especializado.

Deje de lado la discusión entre el AutoML y los científicos de datos, necesitará ambos

Es inútil intentar establecer un ganador en el debate del AutoML frente a los científicos de datos. El futuro no es una discusión entre el AutoML o los científicos de datos, es una discusión entre el AutoML y los científicos de datos.

Los científicos de datos que adopten el AutoML como un acelerador para su potencial serán los verdaderos ganadores.

Los líderes en tecnología deben adoptar el AutoML, no como un sustituto individual para los científicos de datos, sino como una forma de empezar a cosechar los beneficios del machine learning antes de que se pueda desarrollar el conjunto de aptitudes internas de la ciencia de datos, y como una forma de impulsar el impacto de los científicos de datos internos con los que cuenta. Las organizaciones inteligentes pueden empezar a sumergirse en el AutoML ahora mismo y, con el soporte de un conjunto de aptitudes de programadores, estar mejor preparadas para reclutar a los mejores científicos de datos a medida que avanzan.

 

Join the Conversation: Find Solve on Twitter and LinkedIn, or follow along via RSS.

Stay on top of what's next in technology

Learn about tech trends, innovations and how technologists are working today.

Subscribe
Trends-Ebook

¿Está cansado de navegar por las tendencias tecnológicas y esquivar el despliegue publicitario?

About the Authors

Eric Miller - Senior Director, Technical Strategy, Rackspace Technology

VP, Private Cloud Solutions

Eric Miller

An accomplished tech leader with 20 years of years of proven success in enterprise IT, Eric is a strong advocate of cloud native architectural patterns, passionate about Machine Learning, IoT, Serverless, and all things automation in the cloud. Eric has led several AWS and solutions architecture initiatives, including AWS Well Architected Framework (WAF) Assessment Partner Program, Amazon EC2 for Windows Server AWS Service Delivery Program, and a wide range of AWS rewrites for multi-billion dollar organizations.  Prior to joining Rackspace, Eric was the Vice President of AWS Customer Solutions at Onica, which was acquired by Rackspace in 2019. Before working with Onica, Eric held several technology leadership positions at School Pointe, Inc., Neudesic, m2 Consultants, ARGUS International, Inc., Apex Mortgage Services LLC, and TechSkills. Eric lives in New Albany, Ohio with his wife and family. He holds a Bachelor of Science in Information Technology and Information Systems Security from the University of Phoenix.  

Read more about Eric Miller
Mark McQuade

Practice Manager, Data Science & Engineering

Mark McQuade

Mark McQuade is an AWS and cloud-based solution specialist, knowledge addict and relationship builder. Earlier in his career, Mark held technical support, operations, business development and leadership roles for a telecommunications solutions provider, where he worked for 13 years. He then transitioned to the world of cloud and opened up his own AWS small business before joining Onica, who was acquired by Rackspace technology in 2019.   Mark is currently Practice Manager of Data Science & Engineering at Rackspace Technology. Every day, he gets to learn more about what he is passionate about professionally – AI and machine learning – as well as the fascinating world of data. As a technology evangelist, you’ll often find Mark promoting data and AI/ML at talks, webinars, podcasts and industry events.

Read more about Mark McQuade